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Prefácio 


O importante e fascinante assunto das probabilidades teve suas origens no 
século XVII através de esforços de matemáticos como Fermat e Pascal para 
resolverem questões relacionadas com os jogos de azar. Não foi, entretanto, senão 
no século XX que se desenvolveu uma teoria matemática rigorosa, baseada em 
axiomas, definições e teoremas. Com o passar do tempo, a teoria das probabilidades 
viu ampliado seu campo de aplicações, não somente na Engenharia, Ciência e 
Matemática, como em setores que vão desde a Ciência Atuarial, a Agricultura e a 
Economia até a Medicina e a Psicologia. Em muitos casos as próprias aplicações 
contribuíram para um desenvolvimento ulterior da teoria. 


A estatística tem origens bem anteriores às da probabilidade, e dizia então 
respeito à coleta, organização e apresentação de dados em tábuas e cartas. Com o 
advento da teoria das probabilidades, verificou-se que a estatística poderia ser 
utilizada para tirar conclusões válidas e tomar decisões razoáveis com base na 
análise de dados, tais como na teoria da amostragem e na predição. 


O objetivo deste livro é apresentar uma introdução moderna à probabilidade 
e à estatística, utilizando o cálculo como fundamento. Por conveniência, o livro 
está dividido em duas partes. A primeira refere-se às probabilidades (podendo 
servir como introdução ao assunto) e a segunda diz respeito à estatística. 


O livro destina-se a ser usado seja como livro-texto para um curso formal 
em probabilidades e estatística, seja como um suplemento compreensivo a qualquer 
dos outros livros-texto correntes. Pode ser também de considerável interesse como 
livro de referência para pesquisadores ou auto-didatas. Pode servir para um curso 
de um ano ou, mediante escolha criteriosa de tópicos, para um curso semestral. 


Consigno meus agradecimentos ao Testamenteiro Literário do falecido 
Sir Ronald A. Fisher, FRS, ao Dr. Frank Yates, FRS e a Longman Group Ltd., 
Londres, pela autorização para usar a Tábua III de seu Livro Statistical Tables 
for Biological, Agricultural and Medical Research (ба. edição, 1974). Aproveito 
também a oportunidade para agradecer a David Beckwith por seu trabalho editorial 
e a Nicola Monti por seu trabalho de composição. 


M. К. Spiegel 
Setembro 1975 
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Probabilidade 


capítulo 1 


Conjuntos e Probabilidade 


CONCEITO DE CONJUNTO 


O conceito de conjunto é fundamental não somente no estudo da 
probabilidade e da estatística, como para a matemática em geral. Um conjunto 
pode ser considerado como uma coleção de objetos, chamados membros ou 
elementos do conjunto. Em geral, denota-se um conjunto por uma letra maiúscula 
(A, B, С...) e um elemento do conjunto por uma letra minúscula (a, b, c, ...). 
Sinônimos de conjunto: agregado, classe, coleção. 

Se um elemento a pertence a um conjunto C escrevemos a € C. Seanão 
pertence a С escrevemos a € C. Se tanto a como b pertencem a C escrevemos 
a, b € C. A fim de que um conjunto seja bem definido, devemos dispor de uma 
regra que nos permita dizer se determinado objeto pertence ou nào ao conjunto. 

Um conjunto pode ser definido relacionando-se todos os seus elementos, 
ou, quando isto não for possível, indicando uma propriedade que seja válida para 
todos os elementos do conjunto, e somente para cles. O primeiro método chama-se 
método da listagem, o segundo, método da propriedade. 


EXEMPLO 1.1. Podemos definir o conjunto de todas as vogais do alfabeto latino pelo método 
da listagem: (a, e, i, o uyou pelo método da propriedade {хк é uma vogal; que se 16 “o con- 


junto de todos os elementos x tais que x é uma vogal” (a barra vertical significa “tal que”). 


EXEMPLO 1.2. O conjunto ( xlx é um triângulo do plano) é o conjunto de todos os triângulos 
do plano. Aqui não é possível aplicar o método da listagem. 


EXEMPLO 1.3. Se lançamos um par de dados usuais, os “pontos” ou “números” que podem 
aparecer nas faces voltadas para cima são os elementos do conjunto: (1, 2, 3, 4, 5, 6}. 


— 
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SUBCONJUNTOS 


Se todo elemento de um conjunto A é também elemento de um conjunto B, 
dizemos que A é subconjunto de B, e escrevemos 4 C Bou BD A e lemos “A está 
contido em B”, ou “B contém 4”. Segue-se que, qualquer que seja A,A CA. 


Se A CB eB DA dizemos que А e В são iguais e escrevemos А = B. Em tal 
caso, A e B têm exatamente os mesmos elementos. 
Se A e B não são iguais, isto é, se А е B não têm exatamente os mesmos 


elementos, escrevemos А + B. 
Se А C B mas A + В dizemos que A é subconjunto próprio de B. 


EXEMPLO 14. (a, i, u} éum subconjunto próprio de (a, e, i, о, и}. 


EXEMPLO 1.5. (1, 0, а, н, е) 'é um subconjunto, mas não um subconjunto próprio, de 
da, e i0,u) porque os dois conjuntos são iguais. Note-se que um simples rearranjo dos elemen- 
tos não altera o conjunto. 


EXEMPLO 1.6. Na jogada de um dado, os resultados possíveis em que o dado apresenta um 
número “par” são os elementos do conjunto 42,4,6), — que é um subconjunto próprio do 
conjunto de todos os resultados possíveis (1, 2, 3, 4, 5, 6). 


O teorema que segue é válido para quaisquer conjuntos А, B, С. 


Teorema 1-1: Se AC Be B C C, então A C C. 


CONJUNTO UNIVERSAL E CONJUNTO VAZIO 


Em muitos casos restringimos nosso estudo а subconjuntos de um 
determinado conjunto chamado conjunto universal, ou simplesmente universo. É 
também designado por espaço. Representamo-lo pela letra U. Os elementos de um 
espaço costumam chamar-se pontos do espaço. 

É conveniente considerarmos também o conjunto desprovido de elementos: 
é o conjunto vazio, denotado por Ф. O conjunto vazio é subconjunto de qualquer 
conjunto. 


EXEMPLO 1.7. Um conjunto importante, já familiar ao leitor, é o conjunto (i dos números 
reais tais como, 3,—2, 2, п, que podem ser representados por pontos da reta real (o eixo dos 
xx). Se a e b são números reais tais que а «b, os subconjuntos teh xx«b)e ka«x«bk 
de @ (em geral) denotados abreviadamente por a <x <В e а<х <b chamam-se intervalo 
fechado e intervalo aberto, respectivamente. Subconjuntos tais como (x|4<x<b Jou 
fe la «x «b Jdizem-se intervalo semi-aberto ou intervalo semi-fechado. 
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EXEMPLO 1.8. O conjunto de todos os reais tais que х2 =-1, isto é, (x | x22 —1}, éo 
conjunto vazio, pois não existe nenhum real cujo quadrado seja igual a —1. No campo 
complexo, entretanto, este conjunto não é vazio. 


EXEMPLO 1.9. Na jogada de um dado, o conjunto de todos os resultados possíveis é o universo 


(1, 2,3, 4, 5, 6. O conjunto de resultados relativos às faces 7 ou 11, em um único dado, 
é o conjunto vazio. 


DIAGRAMAS DE VENN 


Um universo 1 pode ser 
representado geometricamente 
pelo conjunto de pontos inte- 
riores a um retángulo. Em tais 
casos, subconjuntos de U (tais 
como 4 e B, sombreados na 
fig. 1-1) são representados por 
conjuntos de pontos interiores 
a círculos. Tais diagramas, cha- 
mados diagramas de Venn, são 
úteis para dar uma intuição geo- 
métrica sobre as possíveis rela- 
ções existentes sobre conjuntos. 


Fig. 1-1 


OPERAÇÕES COM CONJUNTOS 


1. União, O conjunto de todos os elementos (pontos) que pertencem a 4, ou 
a B, ou a ambos, é chamado união de A e B; denota-se por A U B (área sombreada 
na Fig. 1-2), 


Fig. 1-2 
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u 


ANB 


Fig. 1-3 Fig. 1-4 


2. Intersecção. O conjunto dos elementos que pertencem a A e a B é chamado 
intersecção de A e B. Denota-se por A MB (área sombreada na Fig. 1-3). 

Dois conjuntos А e B tais que A NB = $ isto é, cuja intersecção é vazia, 
chamam-se conjuntos disjuntos. Na Fig. 1—1, A e B são disjuntos. 


3. Diferença. O conjunto formado pelos elementos de 4 que não pertencem a Bé 
chamado diferença de A e B; denota-se por 4 — B (área sombreada na Fig. 1-4). 


4.Complemento. Se В С А então A — В é o complemento de В em relação a À; 
denota-se рог B/ (área sombreada na Fig. 1—5). Se А = U, o conjunto universo, 
referimo-nos a U—B como o complemento de B; denotamo-lo por B' (área 
sombreada na Fig. 1-6). O complemento de А U В é denotado por (4 U B). 


Fig. 1-5 


ALGUNS TEOREMAS RELATIVOS A CONJUNTOS 


Teorema 1-2: AUB = В\А..............-+..-+ Lei comutativa da 
união 

Teorema 1-3: AU(BUC) = (AUB)UC = AUBUC Lei associativa da 
união 

Teorema 1—4: ANB = ВПА.................... Геі comutativa da 
intersecção 


pe 
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Teorema 1-5: AN(BNC) = (ANB)NC = ANBNC Lei associativa da 


intersecção 

Teorema 1-6: AN(BUC) = (ANB)JU(ANC)........ Primeira lei distri- 
butiva 

Teorema 1-7; AU (Enc) = (AUB)n(AUC........ Segunda lei distri- 
butiva 

Teorema 1-8: A — В = АПВ’ 

Teorema 1-9: Se ACB, então A'DB' ou B'CA' 

Teorema 1-10: AUY = A, AND = Ø 

Teorema 1-11: AUU = uU, ANU = А 

Teorema 1-12a: (AUB) = А'ПВ................- Primeira lei de De 
Morgan 

Teorema 1-12b: (ANB) = АОВ... Segunda lei de De 
Morgan 

Teorema 1-13: А = (АпВ)ц(АпВ”)............ para quaisquer con- 
juntos À e B. 


Os teoremas 1—12a, 1-12b e 1-13 podem ser generalizados (cf. Probls. 
1.69 e 1.74). 


PRINCIPIO DA DUALIDADE 


Qualquer resultado relativo a conjuntos é igualmente válido quando 
substituímos uniões por intersecgóes, іпістѕессбеѕ por uniões, conjuntos por seus 
complementos e se invertemos os símbolos de inclusão C e D. 


EXPERIMENTOS ALEATÓRIOS 


O leitor já está sem dúvida consciente da importância dos experimentos na 
ciência e na engenharia. Um princípio fundamental é que se efetuamos tais 
experimentos repetidas vezes, sob condições praticamente idênticas, obtemos 
resultados que são essencialmente os mesmos. 

Há entretanto, experimentos em que os resultados não são essencialmente 
os mesmos, ainda que as condições de realização se mantenham praticamente as 
mesmas. Tais experimentos chamam-se experimentos aleatórios. Eis alguns exemplos. 


EXEMPLO 1.10. Na jogada de uma moeda o resultado do experimento é o aparecimento de 
uma “cara”, simbolizada por H (ou 1) ou uma “coroa”, simbolizada por T (ou 0), isto é, um 
dos elementos do conjunto (H, Т) (ou do conjunto 10, 1 } De 
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EXEMPLO 1.11. Na jogada de um dado o resultado do experimento é o aparecimento de uma 
das faces 1, 2, 3, 4, 5 ou 6 (і. e., um dos elementos do conjunto 41, 2, 3, 4,5, 6 H ). 


EXEMPLO 1.12. Se jogamos uma moeda duas vezes, os resultados podern ser indicados por 
(HH, HT, TH, TT | duas caras, cara na primeira jogada, coroa na segunda, etc. 


EXEMPLO 1.13. Se dispomos de uma máquina que fabrica porcas, o resultado do experimento 
é que algumas saem defeituosas. Assim, fabricada uma porca, será ela um elemento do conjunto 
{ defeituosas, não-defeituosas } 

EXEMPLO 1.14, Sc nosso experimento consiste em medir a “duração da vida” de lámpadas 
elétricas fabricadas por certa companhia, então o resultado do experimento será um intervalo 
de tempo £, que se situará entre dois valores — digamos, p.ex., 0 &£ <4.000 — admitindo-se 
que nenhuma lámpada dure mais que 4.000 horas. * 


ESPACOS AMOSTRAIS 


Um conjunto с que consiste de todos os resultados possíveis de um experi- 
mento aleatório é chamado espaço amostral; cada resultado é um ponto amostral. 
É comum haver mais de um espaço amostral para descrever os resultados de deter- 
minado experimento, mas em geral apenas um desses espaços nos dá o máximo 
possível de informações. Note-se que -/ corresponde ao conjunto universal. 


EXEMPLO 1.15. Na jogada de um dado, um espaço amostral do conjunto de todos os resulta- 
dos possíveis é (1, 2, 3, 4, 5, 6) enquanto que outro espaço é(par, ímpar).É óbvio, entretanto, 
que este último não será adequado pata determinar, por exemplo, se um resultado é divisível 
por 3. 

É conveniente, sempre que possível, representar graficamente um espaço 
amostral. Em tais casos, é aconselhável usar números ao invés de letras. 
EXEMPLO 1.16. Se jogamos uma moeda duas vezes e utiliza- 
mos O para representar “coroa” c 1 para representar “cara”, 
o espaço amostral é o da Fig. 1—7, onde, p.ex., (0, 1) repre- (0:3) "un 
senta “coroa” na primeira jogada, “cara” na segunda, 1.6, TH e и 


Se um espaço amostral tem um número finito — 
de pontos, é chamado um espaço amostral finito (0,0) 1,0) 
(como no Ex. 1.16). Se tem tantos pontos quantos Fig. 1-7 


são os números naturais 1, 2, 3, ..., chama-se um 
espaço amostral infinito numerável. Se tem tantos pontos quantos um determinado 
segmento do eixo dos xx, tal como 0 < х <1, chama-se um espaço amostral infinito 
não-numerável. Um espaço amostral finito, ou infinito numerável, é chamado fre- 
qüentemente espaço discreto, enquanto que um espaço amostral infinito 
não-numerável é um espaço não-discreto, ou contínuo. 


EVENTOS 

Um evento é um subconjunto A do espaço amostral гї, 1.6, é um conjunto 
de resultados possíveis. Se o resultado de um experimento é elemento de А, dize- 
mos que o evento А ocorreu. Um evento que consiste de um único ponto с) costuma 
chamar-se evento simples, ou evento elementar. 
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EXEMPLO 1.17. Se jogamos uma moeda duas vozes, 
о evento que consiste em aparecer cara apenas uma vez 
é o subconjunto do espaço amostral que consiste dos 
pontos (0, 1) e (1, 0) tal como indicado na 
Fig. 1-8. 


Como eventos particulares temos o 
próprio «Y que é o evento certo, pois deve sem- 
pre ocorrer um elemento de «J e o conjunto 
vazio Ø, que é o evento impossível, porque não 
é possível a ocorrência de um elemento de @ 

Como os eventos são conjuntos, é óbvio que quaisquer afirmações relativas a 
eventos podem ser traduzidas em termos de conjuntos e vice-versa. Em particular, 
tem-se uma álgebra de eventos correspondente à álgebra de conjuntos indicada na 
página 3. 

Aplicando aos eventos de ci as operações sobre conjuntos, obtemos outros 
eventos de cf. Assim, se 4 e B são eventos, então 


Fig. 1-8 


1.4UBé o evento “A, ou B, ou ambos”. 
| 2.An Béoevento A 2 B. 
| 3.4'éo evento “não-A”. 
| 4.A —B é o evento “A mas não B". 


Se os conjuntos correspondentes aos eventos 4 e B sáo disjuntos, isto é, se 
ANB = Ø, diz-se que os eventos são mutuamente excludentes. Significa isto que 
os eventos em questáo ndo podem ocorrer simultaneamente. 


EXEMPLO 1.18. Referindo-nos ao lançamento de uma moeda duas vezes, seja À o evento 
“aparece ao menos uma cara” e B o evento “o resultado do segundo lançamento é coroa”. 
Então A = (HT, TH, HH}, В = (HT, TT) е temos 


АОВ = (HT, TH, HH, TT) = ој AnB = (HT) 
A! = ATT) А-В = (TH, HH) 


O CONCEITO DE PROBABILIDADE 


Em qualquer experimento aleatório, há sempre uma incerteza quanto á 
ocorrência, ou não, de determinado evento. A fim de obtermos uma medida de 
chance, ou probabilidade, com que podemos esperar a ocorréncia de determinado 
evento, é conveniente atribuirmos um número entre O e 1. Se temos a certeza de 
que o evento ocorrerá, dizemos que sua probabilidade é 100%, ou 1; se estamos 
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certos de que ele não ocorrerá, dizemos que sua probabilidade é zero. Se, por 
exemplo, à probabilidade é 1, diremos que há uma chance de 25% de ocorrência, 
e uma chance de 75% de não-ocorrência; ou, equivalentemente, que as chances 
contra sua ocorrência são de 75% para 25%, ou de 3 para 1. 

Há dois processos importantes para se obter a estimativa da probabilidade de 


um evento. 


1. Processo clássico, ou “a priori”. Se um evento pode ocorrer de h maneiras 
diferentes, em um total de п maneiras possíveis (todas igualmente prováveis), 
então a probabilidade do evento é h/n. 


EXEMPLO 1.19. Suponha-se que desejemos determinar a probabilidade do aparecimento de 
1 cara em uma jogada de uma moeda. Como há dois resultados igualmente prováveis, a saber, 
“cara” e “coroa” (admite-se que a moeda não se detenha sobre seu bordo), e como só há uma 
maneira de aparecer "cara", dizemos que a probabilidade do evento “cara” na jogada de uma 
moeda é 1/2. Naturalmente, para que tal conclusão seja válida, é preciso que a moeda seja 
“honesta”, ou “não-viciada”. 


2. Processo da frequência, ou “a posteriori”. Se após m repetições de um 
experimento (n suficientemente grande), se observam h ocorrências de determinado 
evento, então a probabilidade do evento é h/n. Essa probabilidade é chamada 
também probabilidade empírica. 


EXEMPLO 1.20. Se jogamos uma moeda 1.000 vezes e aparece cara 532 vezes, estimamos a 
possibilidade de cara em 532/1.000 =0,532 


Tanto o processo clássico, como o processo da freglência, apresentam sérias 
dificuldades: o primeiro, porque a expressão “igualmente provável” é assaz vaga; 
e o segundo, porque é igualmente vaga a expressão “suficientemente grande”. 
Dificuldades tais levaram os matemáticos, nesses anos recentes, a procurar uma 
definição axiomática da probabilidade, utilizando conjuntos. 


“OS AXIOMAS DA PROBABILIDADE 


Suponhamos um espaço amostral cj. Se cJ é discreto, todos os subconjun- 
tos correspondem a eventos, e reciprocamente. Mas se cl é contínuo, apenas de- 
terminados subconjuntos (chamados mensuráveis) é que representam eventos. А 
cada evento A na classe C йе eventos associamos um número real P(A), isto é, 
P é uma função real definida em (7. P é então uma função de probabilidade, e А) 
é a probabilidade do evento A, desde que sejam satisfeitos os seguintes axiomas: 
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Axioma 1. Para todo evento А da classe £ 


P(A) > 0 (1) 
Axioma 2. Para o evento certo «Y da classe C | 
P(Y) = 1 (2) 
Axioma 3. Para um número qualquer de eventos mutuamente excludentes Ar, As, 
da classe C 
P(AiUAsU---) = P(A) + P(Ag) t: (8) 
Em particular, quando temos apenas dois eventos mutuamente excludentes 
As, A», 
P(A UA) = P(A) + P(A») a 
= 


ALGUNS TEOREMAS IMPORTANTES SOBRE PROBABILIDADE 


Com base nos resultados acima, podemos agora demonstrar vários teoremas 
sobre probabilidades, importantes para o nosso trabalho. 


Teorema 1—14: Se А, С.А; então Р(А,) <P(A,) e P(A2 41) =P (4) РСА). 


Teorema 1—15: Para todo evento 4 
0 < Р(А) < 1 (5) 
isto é, a probabilidade está sempre entre O e 1. 


Teorema 1—16: PO) = 0 (6) 
isto é, o evento impossível tem probabilidade zero. 


Teorema 1—17: Se 4' é o complemento de 4 então 
P(A) = 1—P(A) (7) 


Teorema 1-18: Se A=AUAU---UAn, onde Ai, Az,..., Аһ 
sáo eventos mutuamente excludentes, entáo 


P(A) = P(A) + P(Az) + +: + P(An) (8) 


Em particular, se А = cJ, (espaço amostral), então 


P(A) + P(A2) + o + P(A) = 1 (9) 
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Teorema 1—19: Se A e B são dois eventos quaisquer, então 
P(AUB) = P(A) + P(B) - P(ANB) (10) 
Mais geralmente, se А1, A», As são três eventos quaisquer, então 


P(A1UA2UAs) = P(A) + P(As) + P(As) 
— P(A,N As) — P(A2 As) — P(As As) 
+ Р(Ауг\АзП Аз) (11) 


Para generalizar рага п eventos, у. Probl. 1.79. 


Teorema 1—20: Рага quaisquer eventos А e В 


P(A) = P(ANB) + P(An B^ (12) 

Teorema 1-21: Se um experimento 4 deve resultar em um dos eventos 
mutuamente excludentes 41, As», ..., An então 

P(A) = P(ANA:) + Р(АПА») + -++ + P(AD As) (13) 


ATRIBUIÇÃO DE PROBABILIDADES 


Se um espaço amostral consiste apenas dos eventos elementares 4, , 42, ..., Аһ, 
entáo, pelo Teorema 1—18, 


P(A) + P (42) + + + P(A) = 1 (14) 


Decorre daí que podemos escolher arbitrariamente quaisquer números 
não-negativos para probabilidades desses eventos simples, desde que (14) seja 
satisfeita. Em particular, se admitimos probabilidades iguais para todos os eventos 
simples, então 1 

P(A) = P kol Aout (15) 


e se A é um evento formado por h desses eventos simples, temos 


Pa) = Ё (16) 


Isto equivale ao processo clássico mencionado na página 5. Poderíamos, 
naturalmente, utilizar outros processos para a atribuição das probabilidades, como, 
p. €x., o processo da frequência (página 8). 

A atribuição de probabilidades origina um modelo matemático, cuja eficátia 
deve ser testada através de experimentos, precisamente da mesma maneira como 
se testam as teorias da física ou de outras ciências. 
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EXEMPLO 1.21. Lança-se um dado. Determinar a probabilidade de aparecer 2 ou 5. 
Espaço amostral: cf = {1,2,3,4, 5,6}. Atribuindo probabilidades iguais aos pontos 
amostrais (isto é, admitindo que o dado é "honesto") temos 


Р) = РӘ) = = PO = i 
| Indicamos o evento "ou JS" por 2U5. Assim, pois 
PQus = Р@ + Р(5 = 1. = 5 
PROBABILIDADE CONDICIONAL 
Sejam A e'B dois eventos (Fig. 1-9), com P(A) > 0. Denotemos por 


Р(В |А) а probabilidade de ocorrincia de B, na hipótese de A ter ocorrido. Ora, 
como А ocorreu, А passa a ser O novo espaço amostral, que vem substituir o espago 
original cf. Isso nos conduz à definição 


P(B|A) = Pea (17) 
el P(AnB) = P(A) P(B|4) (18) 


Em palavras, (18) nos diz que a probabi- 
lidade de ocorrência de A e)B É iguai à 
probabilidade da ocorrência de 4 vezes 
a probabilidade da ocorrência de B na 
hipótese de 4 ter ocorrido. Chamamos 
P(B/A) a probabilidade condicional de 
B, dado 4, isto é, a probabilidade de 
ocorrência de B, dado que А ocorreu. 
É fácil mostrar que a probabilidade condi- 
cional verifica os axiomas da página 9. 


o 


EXEMPLO 1.22, Determinar а probabilidade de a jogada de um dado resultar em um número 
menor que 4 (a) se não temos nenhuma outra informação e (b) sabendo-se que o resultado éum 
número impar. 

(a) Seja B o evento (menor que 4 ds Como B é a união dos eventos 1, 2, ou 3, vê-se, 
pelo Teorema 1.-18, que A 1 

PB) = PD+PD+PB) = ¿+5 += = 3 

admitindo-se probabilidades iguais para todos os pontos amostrais. 

(b) Seja A o evento (número ímpar ) Vemos que P(A) = & = 4 


Outrossim, P(ANB)=2=4. Então 


pon _ 1% 
P(A) 1/2 


co| ro 


P(B|A) = 
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Assim, o conhecimento de que o resultado é um número ímpar, eleva de 1/2 para 2/3 a 
probabilidade. 


TEOREMAS SOBRE PROBABILIDADE CONDICIONAL 


Teorema 1—22: Para três eventos quaisquer 41, Аз, Аз 
| P(ANANAS) = P(A) P(As| A) P(As| Aui А») (19) 
Em palavras, a probabilidade da ocorrência conjunta de А; е A, е Ay é igual à pro- 


babilidade da ocorrência de A, vezes a probabilidade de ocorrência de Az, sabendo- 
se que 4, ocorreu vezes a probabilidade de ocorrência de As sabendo-se que 
A, € À, ocorreram. 

Teorema 1-23: Se um experimento A deve ter como resultado um dos eventos 
mutuamente excludentes Аз, As, . . ., An então 


P(A) = P(A) P(A | A) + P(A P(A |Аз) + co + РА) PIA | Am) (20) 


EVENTOS INDEPENDENTES 


Se P(B/A) = ВІВ), isto é, se a probabilidade de ocorrência de B não é afetada 
pela ocorrência, ou não de 4, dizemos que Ae B são eventos independentes. Isto 
equivale a 

P(ANB) = P(A) P(B) (21) 
como se pode ver de (18). Reciprocamente, se (21) se verifica, A e B são indepen- 
dentes. Os Problemas 1.91 e 1.92 apresentam algumas propriedades da independén- 


cia. 
Se As, A», As são independentes, então eles devem ser independentes dois 


a dois 
Р(А:пАк) = P(A) P(A) j-k onde j,k=1,2,3 (22) 


e também devemos ter P(ANANAS) = P(A P(A») P(A) (23) 


Nenhuma das expressões (22) ou (23) é por si só suficiente. É fácil generalizar 
para mais de três eventos. 


TEOREMA (ou REGRA) DE BAYES 
Sejam A: Аз, ..., An eventos mutuamente excludentes, cuja união é o 


espaço amostral ci, isto é, um dos eventos deve forçosamente ocorrer. Então, 
se A é um evento, temos o seguinte Teorema: 
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Teorema 1-24 (Regra de Bayes): 

P(A) P(A | Ак) _ 
$ Р(А)Р(А | А) 
k=1 


P(Ax | A) (24) 


Este teorema nos permite determinar as probabilidades dos vários eventos Аз, As, 
..., An que podem ser a causa da ocorrência de A. Por esta razão, o teorema de 
Bayes é mencionado frequentemente como teorema da probabilidade das causas. 


ANALISE COMBINATÓRIA 


Em muitos casos, o número de pontos do espaço amostral não é muito 
grande, permitindo assim a enumeração ou contagem direta dos pontos amostrais 
necessários para a determinação de probabilidades. Surgem, entretanto, problemas 
em que essa contagem é praticamente impossível. Em tais casos lança-se mão da 
análise combinatória, que pode ser encarada como um processo sofisticado de 
contagem. 


PRINCIPIO FUNDAMENTAL DA CONTAGEM. 
DIAGRAMAS EM ÁRVORE 


Se um resultado pode ser obtido de nı maneiras diferentes; e se, após isso, 
um segundo resultado pode ser obtido de ns maneiras diferentes;...... , €, finalmen- 
te, se um КО resultado pode ser obtido de 1y maneiras diferentes, então, todos os 
kk resultados podem ser obtidos, na ordem especificada, de nina*: ny manei- 
ras diferentes. 


EXEMPLO 1.23. Se um homem tem duas camisas e quatro gravatas, poderá escolher uma 
camisa e uma gravata de 2.4 = 8 maneiras diferentes. 


Costuma-se utilizar um diagrama — chamado diagrama em árvore, em razão 
de sua aparência (Fig. 1-10) — na aplicação do princípio acima. 


EXEMPLO 1.24. Representemos as camisas por 51 e 52 c as gravatas por Тү, T5, Тз, T4. 
As diversas maneiras de escolher uma camisa e uma gravata acham-se indicadas no diagrama 
em árvore da Fig. 1-10. 


PERMUTACOES (ARRANJOS) 


Sejam dados n objetos distintos; queremos dispor г desses objetos em uma 
fileira. Como há n maneiras de escolher o primeiro objeto e, após isso, n — 1 manei- 
ras de escolher o segundo, ..., e finalmente n — г + 1 maneiras de escolher o r? 


14 PROBABILIDADE F ESTATISTICA 


Fig. 1-10 


[ de A 


objeto, decorre do princípio fundamental de contagem que o número de arranjos, 
ou permutações distintas é dado por 


„Р, = n(n—1)(n—2)---(n—r-1) (25) 


Note-se que o produto tem г fatores. „Р, é o número de arranjos de n objetos ra r. 
No caso particular г = n, (25) se escreve Е 


аР, = п 1)(0— 2): :-1 = n! (26) 
que é o fatorial de n. Podemos escrever (25) em termos de fatoriais: 
n! 4! А 
| aP, = mt (27) 


¡A 
Se r = n, vê-se que (25) e (26) concordam somente se convencionamos que 0! = 1. 
Esta será, com efeito, a definição de 0! 


EXEMPLO 1.25, Com as sete letras A, B, C, D, E, F, G, podemos formar 


¿Py = 1 = 7:65 = 210 


arranjos distintos de 3 letras cada. 


Suponhamos agora que um conjunto consista de т objetos, dos quais n .são de 
um determinado tipo (isto é, não se distinguem entre si), и de um segundo tipo, ... 
» Ny de um КО tipo. Naturalmente, n = m + fis -` - ER Entáo, o número 
de permutações distintas dos n objetos é 

n! 
"Poy mala! nl 


V. Problema 1.34. (28) 


ар 
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EXEMPLO 1.26. O número de permutações distintas das 11 letras da palavra MISSISSIPPI 
(que consiste de 1 M, 4 II, 4 SS e 2 PP é 


11! 


maai c $4999 


COMBINAÇÕES 


Nas permutações (arranjos) intervém a ordem dos objetos. Assim, abe é uma 


nação. o 
O número total de combinações de 7 objetos escolhidos dentre п (também 


chamado combinações de n objetos r a r) é denotado por «Cr ou pol Temos (v. 
Problema 1.36) a 


w cu a AE (29) 


Podemos escrever também 


n n(n—1)::(n—-vr-1) _ «P. 

^i = vi o a (30) 
É fácil mostrar que 

Н m п \ = 

"E m _ " ou „С, = „Са-+ (31) 


COEFICIENTES BINOMIAIS 


Costuma-se designar os números (29) como coeficientes binomiais, pelo fato 
de os mesmos aparecerem no desenvolvimento binomial ' 


dux napi rupe ecc m 
(+y = oc q ay 2 Uy + 4/7 (32) 


Esses coeficientes têm muitas propriedades interessantes. 
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EXEMPLO 1.28. 


(a+ y)! 


f. 
1 ey - (4 2/2 (4 3 da 
gh + " у + e ay + \з cy? + la Y 


ай + дабу + Ox? + day + yt 


I 


APROXIMAÇÃO DE STIRLING PARA n! 


Quando n é grande, o cálculo de n! torna-se impossível, praticamente. Em tais 
casos utiliza-se a fórmula aproximativa 


n! ~ Vanne" (33) 
onde 2,71828... é a base dos logaritmos naturais. V. Problema 1.48. O sím- 
bolo ~ em (33) significa que a razão do membro esquerdo para о membro direito 
tende para 1 quando т > ©, A expressão à direita é, assim, um desenvolvimento 
assintótico de n!.Para mais detalhes sobre a fórmula de Stirling, v. Apéndice A. 


Problemas Resolvidos 


CONJUNTOS 


1.1. Seja A o conjunto de todos os reais cujos quadrados são iguais a 25. Descreva 
A (a) pelo método da propriedade, (b) pelo método da listagem. 


(a) A= ix lx? = 25) que se 18 “A é o conjunto dos elementos x tais que х? „25° 
(b) Como x^ = 25 para x = 5 e x = —5, podemos escrever А = (5, —5 ),isto é, descre- 
vemos 4 enumerando seus elementos. 


1.2. Sejam os conjuntos А = ( x |x é inteiro ímpar), В = (x 1х? — 8x + 15 = 0) 
Mostre que BC A. 
Como 22 — 8х + 15 = 0 ou (z — 3)(x— 5) = 0 |se e somente sex=30ux=5, 
temos (В = (3,5). 


E como os elementos 3 e 5 são ambos inteiros ímpares, pertencem a 4. As- 
sim, todo elemento de B pertence a A e, portanto, B С A, ié, Bé subconjunto de А. 


1.3. É verdade que (2) = 27 
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Y 
Não. 2 é um número real, enquanto que ( 2 ] é um conjunto que consiste do nümero real 
2. Um conjunto constituído de um único elemento chama-se conjunto unitário; deve-se | 
fazer distinção entre um conjunto unitário e o elemento que ele contém. 


14 Determine quais das seguintes afirmações são verdadeiras, e quais são falsas. 
(а) (jara) = {Ø} 
(0) Se A = (8 | 4,229) еВ = (| a< 1), então BA. 


| (a) Falsa. Qualquer objeto é idêntico a si próprio. Não existe objeto algum que não seja 
igual a si mesmo. Então, te p xy a) = Ø, o conjunto vazio. O erro está em escre- 


ver (65) em lugar de 0), poist 5 é um conjunto não-vazio, consistindo de um elemento 


— o conjunto vazio. = B 


(b) A notação nos diz que “А é o conjunto de todos os x tais que a2=4 e 
Como náo há nenhum número x tal que а? = 4 [oux=2,-2] e 
segue-se que А = Ø. Outrossim, como o conjunto vazio é subconjunto de qualquer 
conjunto, segue-se que ACB ou BIA Visto é, a afirmação é verdadeira. 


x89. 


L5. Prove que se ACBe BCC, entáo ACC. 


Seja x um elemento de A, isto é, & € A. Então, como A C Bisto é, todo elemento de À 
está em B, temos que x Є B. Outrossim, comoH C C temos = € С, Assim, todo elemento 
de A é elemento de C e, consequentemente, Av. 


OPERACOES COM CONJUNTOS, DIAGRAMAS DE VENN E 
* TEOREMAS SOBRE CONJUNTOS 


16 Seja о universoU = 4,0,7,5, -y2, —4) Se А = (-v2,7,0), 
B=(5,4,-V2,-4) e С = (3,4) 1820 subconjuntos de Ju determine 


(a) A^ B, (5) AUB, (e) (AUB) NC, (d) BUG, (9 A-B, 
(f) (BACY, (9) (ANC) u (ВПС). 


(а) ANE = {V7 0} п 45,4, V D 2) 

(B AUB = (12,700 {5,Ь—У®—4} = 612705, 4-4 

() (АОВ) пС = {-У, п,0,5, 8.0 0 04,4 = (4, 4) utilizando o 
resultado йе (5). 


(d) В' = conjunto dos elementos de U que não estáo em B= (0,7) 
C' = conjunto dos elementos de “y que não estao em C= {0, л, 5, -/? } 


Então PUC! = 10,7) U (0,75, V2 = (0,7,5,V2). 


(e) А — В = conjunto dos elementos de A que não estáoem B = (0, т}. 


Outro Método: Pelo Teorema-1—8, página 3, temos 
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А-В = AnB' = (1,0,7,5,-V2,—4) n (0,7) = (0,7) 
U) BnC = 5,4-V2,-4) п (4,4) = (4. 
Então (ВПС) = 10,7,5,—V2). 


Note-se que este resultado, juntamente com o da parte (d), ilustra a segunda lei 
de De Morgan, Teorema 1 — 12b, página 5. 
(9) ANC = (-V2,7,0 n (3, —4) = Ø, conjunto vazio 


BnC = (8,4) [v parte (0] 
Pii псу (вп) = PU (p= = 4-0 
1.7. (a) Prove a primeira lei de De Morgan, Teorema 1-12a, pág. 5: 
(AUB) = АПВ". 
(b) Ilustre o resultado da parte (a) por meio de um diagrama de Venn. 
(a) Temos 
(АОВ) = {zx | + AUB} = 
{x | EA, 2€B) = 4nB' 


Este resultado pode ser estendido a um número finito qualquer de conjuntos (v. 
Probl. 1.69). 


(6) No Diagrama de Venn da Fig. 1-11, a parte sombrcada representa (4 U В). Na 
Fig. 1-12, A! está indicado por paralelas tragadas da direita superior para a esquer- 
da inferior, e B por paralelas da esquerda superior para a direita inferior. ana 
está, então, representado pela região duplamente hachurada; vê-se que esta região 
é a mesma região sombreada da Fig. 1-11. 


Parte sombreada = (A ОВ) Parte duplamente hachurada = 4" N В 
Fig. 1-11 Fig. 1-12 


Note-se que um diagrama de Venn não constitui uma prova, tal como a dada na 
parte (a); serve, todavia, para evidenciar possíveis relações entre conjuntos, as quais 
poderão então ser demonstradas por métodos análogos aos do item (a). 
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1.8. Prove a primeira lei distributiva, Teorema 1—6, pág. 5: 
AN(BUC) =(ANB)U(ANC). 


Temos AN(BUC) = {x | rEA, + Є ВОС} 
= (x|x€A,x€BouxeC) 
= (|s€A, zeBouzCA,z€0€) 
= {x | zEANB ou xe ANCy 
= (ANB)U(ANC) 


1.9. Prove que, para quaisquer conjuntos А e B, se tem А = (ANB) U(ANB”. 


Método 1 
A = te |2€A) = {x | 2€ANB ouzEANB!) = 


= (ANB) о (An B!) 
Método 2 
Seja C=B' no Problema 1.8. Então 
AN(BUB) = (ANBJU (ANB) 
Апи = (ANBJU(ANB) 
A = (ANBJU(ANB) 


Este resultado pode ser generalizado (v. Problema 1.74). 


EXPERIMENTOS ALEATÓRIOS, ESPAÇOS AMOSTRAIS, 
EVENTOS 


1.10. De um baralho comum de 52 cartas extrai-se uma carta ao acaso. Descreva o 
espaço amostral (a) não se levando em conta os naipes, (b) levando-se em 
conta os naipes. 


(a) Não se levando em conta os naipes, o espaço amostral consiste de ás, dois, três, ..., 
dez, valete, dama, rei, podendo ser representado por (1, 2, ..., 13). 


(b) levando-se em conta os naipes, о espaço amostral consistirá de ás de copas, ás de 
espadas, ás de ouros, ás de paus; ...... ; rei de copas, rei de espadas, rei de ouros, 
reis de paus, Denotando copas, espadas, ouros e paus respectivamente por 1, 2, 3, 
4, por exemplo, podemos indicar o valete de espadas por (11,2). O espaço amos- 
tral consistirá dos 52 pontos exibidos na Fig. 1-13. 
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Fig. 1-13 


1.11. Referindo-nos ao Prob]. 1.10, seja А o evento (extração de um теі ou simples- 


mente (rei) e B o evento (extração de uma carta de paus } ou simplesmente 


| {carta de paus). Descreva os eventos (a) А U B, (D An B, () АЧ B', 

(d) A'U', (e) A — B, (f) A' — В, (g) (А NB) U (An B. 

(a) AU B = (rei ou paus (ou ambos, isto é, rei de paus)) 

(b AnB = (sic paus) = { rei de paus) 

(с) Сото B Ívaus)B'= [não-paus)= ( copas, ouros, espadas ) 

Então 4 UB'= (rei ou copas ou ouros ou espadas 
(d)  A'U B' = | n&o-rei ou não-paus }= (não-rei de paus } = [qualquer carta exceto 
| rei de paus |. Pode-se obter este resultado também notando que А UB =(A NB) 
| e utilizando (b). 

( A-B= {rei mas nãopaus} | 
É o mesmo resultado que A (Y B = {rei e não-paus } 

(Q) 4'-B'"= [náoxci e não “não-paus” }= dnáo-rei e paus )= {qualquer carta de 
paus exceto rei | Pode-se chegar a este resultado também notando que Æ — В'= 
=4'M(BY=A NB. 

(Y  (4NB)U (а гв?) = Leio paus) ou (sei e não-paus) 1={ rei) 


Chega-se a este resultado notando que (ANB) U (А NB’) = A. 


1.12. Use a Fig. 1—13 para descrever os eventos (a) АОВ, (b) A'n B'. 


Os eventos desejados estáo indicados no diagrama de Venn da Fig. 1-14. De modo 


análogo, todos os eventos do Probl. 1.11 podem também ser indicados por diagramas de 
Venn. Note-se que, pela Fig. 1-14, A'(18' é o complemento de AUB, , de acordo com o 
Teorema 1-12, pág. 5. 
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Fig. 1-14 


TEOREMAS SOBRE PROBABILIDADES 
1.13. Prove (a) o Teorema 1—14,(b) o Teorema 1—15, (c) o Teorema 1—16, página 9. 


Temos 45 74, U(42 — 41) onde A, e 45 — 4] são mutuamente excludentes. 
Então, pelo Axioma 3, pág. 9, 
P(A) = MA) + P(A, — Ay) 
de modo que P(A, А) = P(A2) — P(A) 
Como P(A, — 41) 20 pelo Axioma 1, pág. 6, decorre também que P(45) >P). 


(a) 


Já sabemos que P(A) > Opelo Axioma 1. Para provar que P(A) < 1notemos pri- 
meiro que А С ¢f-Assim, pelo Teorema 1—14, parte (а) e pelo Axioma 2 


P(A) < Р) = 1 
Temo cf = JU). Como [NØ =Ø aecorre do Axioma 3 que 


PiS) = PIS) + PØ) ош Pg) = 0 


(b) 


(o) 


1.14. Prove (a) o Teorema 1—17 e (b) o Teorema 1—19. 


(a)  TemosAUA' = «J.Então, comoA NA” = Ø vem 
P(AUA!' = P(4) ou P(A) + P(A) = 1 
ie, P(A) = 1— P(A) 
(b) Temos, pelo diagrama de Venn da Fig. 1-15 (1) A UB = A U[B — (4 NB)] 
Então, como os conjuntos А e B — (АПВ) são mutuamente excludentes, temos 
pelo Axioma 3 e Teorema 1-14: . 
P(AUB) _ Р(А}+Р(В-(АГ\В)) 
= P(A)+P(B) -P(ANB) 
Embora tenhamos utilizado o diagrama de Venn, o resultado (1) pode ser estabe- 
tecido diretamente (v. Probl. 1.77). 
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AnB 


e 


B — (An B) 


Fig. 1-15 


CALCULO DE PROBABILIDADES 


1.15. Extrai-se ao acaso uma carta de um baralho ordinário de 52 cartas. Deter- 
mine a probabilidade de a carta ser (a) um ás, (b) o valete de copas, (c) três 
de paus ou seis de ouros, (d) uma carta de copas, (e) de qualquer naipe exceto 
copas, (f) um dez ou uma carta de espadas, (g) nem quatro nem carta de paus. 


Denotemos copas, espadas, ouros e paus por C, E, O, P, respectivamente, e ás dois, 
três, ..., rei por 1, 2, 3,..., 13, respectivamente. Então 3 NC significa trés de copas, 
enquanto que 3 UC significa trés ou copas. Utilizemos o espaço amostral do Problema 
1.10 (b), atribuindo a mesma probabilidade 1/52 a cada ponto do espaço amostral. Assim, 
por exemplo, 


M 


P(inC ou 1n Eou 100 ou 1nP) 
= P(üncC) + Pün E) Pano)-* PON Р) 


(a) PG) 


= а. 1 
E E 


Poderíamos ter chegado a este mesmo resultado a partir do espago amostral do 
Probl. 1.10 (a), em que cada ponto tem probabilidade 1/13. Ou também raciocinando 


simplesmente que, havendo 13 números, cada um deles tem a probabilidade 1/13 de 
ser extraído. 


1 a 
(6) PUNC) = 55 
ч = у - sd ql HL 
(с) P(8nPou6nO) = P(BNP) + P(6nO) = 55 + go T 
i dl 1 13. 1 


(d P(C) = P(INC ou2nC ou ... 180€) = 5 bz Ыы 
Poderíamos também chegar а este resultado notando que há 4 naipes e que сайа 
um tem a probabilidade 1. de ser extraído. 


() PO) = 1- NO = i-i - $ utilizando (d) e o Teorema 1-17, pág.6 
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Ф Como 10 е Enáo sáo mutuamente excludentes, temos, pelo Teorema 1-19, 
1 1 1 4 
= P(E) — =2+.-5= 5 
P(10UE) P(10) + P(E) — P(10NE) ntm 25 
(g) А probabilidade de “nem 4 nem paus” pode ser denotada por Р(4' N P^. Mas, 
pelo Teorema 1-12 (а), pág.3, 4'n P' = (4UP). Assim, 


P(4nP) = P[4uPy] = 1— P(4UP) 
= 1— [P(4) + P(P) — P(4NP)] 


Rd ` 9 
=1-|5+5-3|>=% 

18 4 A 13 
Poderíamos também obter este resultado notando que o diagrama de Venn favorável a 
este evento é o complemento do evento representado pela área sombreada da fig. 1-16. 
Como este complemento tem 52 — 16 = 36 pontos e cada ponto amostral tem proba- 
bilidade 1/52, a probabilidade desejada é 36/52 = 9/13. 


1.16. Extrai-se ao acaso uma bola de uma caixa que contém 6 bolas vermelhas, 4 


brancas e 5 azuis. Determine a probabilidade de a bola extraída ser (a) verme- 
Tha, (b) branca, (c) azul, (d) não-vermelha, (e) vermelha ou branca. 


(a) Método 1 


Denotemos por R, W e B os eventos correspondentes à extração de bola 
vermelha, branca, e azul, respectivamente. Então 


PR) = NO de escolhas de bola vermelha _ 6 E: 
МО total de escolhas 6+4+5 15 5 
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Método 2 


Nosso espaço amostral consiste de 6 +4 +5 = 15 pontosamostrais. Atribuindo-se 
então a cada ponto a mesma probabilidade 1/15, vê-se que P(R) = 6/15 = 2/5, pois há 
6 pontos amostrais que correspondem a bola “vermelha” 

4 4 


© PM) = угуз à 


a 5 "o 
() PB-grr:g-35 3 


| (d) Р (niovermelha) = P(R) = 1— P(R) = p E = : conforme (4) 
| (e) Método 1 
P (vermelha ou branca) = P(RUW) = 
— N? de escolhas de vermelha ou branca _ 
N total de escolhas 
6+4 10 _2 


= 6+4+5 15 3 


Pode-se resolver também utilizando o espaço amostral da parte (2) 


Método 2 1 2 
P(RUW) = P(B) = 1-P(B) = 1— po a conforme (e) 
| Método 3 
| Como os eventos R e W são mutuamente excludentes, decorre de (4), pág. 6, que. 
2 4 2 
] - H = pis E 
P(RUW) P(R) + P(W) 5*15 3 


PROBABILIDADE CONDICIONAL E EVENTOS INDEPENDENTES 


1.17 Тора-зе um dado “honesto” duas vezes. Determinar a probabilidade de se 
\ obter 4, 5 ou 6 na 12jogada e 1, 2, 3 ou 4 na 22 jogada. 
| Seja Ar, O evento “4, 5 ou 6 na 12 jogada” e Az о evento “1, 2,30u4 
' na 24 jogada”. Desejamos obter P(A; N 42). 


Método 1 
| 3 4 1 
PANA)=PA) КАЗА) 2 PA.) PA) = = — 
6 6 3 
Utilizamos aqui o fato de que o resultado da 2% jogada é independente do resultado da 
1% jogada, de modo que P(A» 141) =P(42). Também utilizamos P(A1) =3/6 pois 


4, 5 ou 6 são três dentre seis resultados igualmente prováveis, e P(42) = 4/6 (pois 1, 2, 3 
ou 4 sáo quatro dentre seis resultados igualmente prováveis). 
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Método 2 


Cada uma das seis maneiras em que o dado pode cair na 12 jogada pode associar- 
se a cada uma das 6 maneiras em que ele pode cair na 22 jogada, ou seja, um total de 
6.6 = 36 maneiras igualmente prováveis. 

Por outro lado, cada uma das 3 maneiras em que 4, pode ocorrer pode associar-se 
a cada uma das 4 maneiras em que 4; pode ocorrer, о que nos dá 3.4 = 12 modos de 
ocorrência de A4 e Аз. Então 

al 


PANA) = 4 = 3 


Isso nos mostra que A; e 42 são independentes, pois, 


Pana) = 1 = ) = P(A) PAS 


. Determinar a probabilidade " Е 
de não se obter 7 ou 11 ет (2.6) (8.6) 
em nenhuma de duas jogadas 
Че dois dados honestos. 


A Fig. 1-17 exibe o espa- 
ço amostral de cada jogada. P. 
Ex., (5,2) representa o evento 
“5 na 12 jogada, 2 na 22", Como 
há 36 pontos amostrais, atribuí- 
mos a cada um deles a probabili- (2,2) (8,2) 
dade 1/36. 

se A indica o evento “7 ed» 
ou 11”, então А é representa- 
do pela porgio sombreada na 
Fig. 1-17. Como essa por- | рине dado 
ção compreende B pontos, te- E 
mos que P(A) = 8/36 = 2/9. Se Fig. 1-17 
gue-se então que a probabilidade 
de não se obter 7 ou 11 é dada por 


© 


(2,3) 


Segundo dado 


ю 


PA) = 1—Р(А) = 1-6 = 


Bad 
9 9 


Utilizando os índices 1 е 2 para denotar a 18 e a 22 jogadas dos dados, vemos que a pro- 
babilidade de nào aparecer 7 ou 11 em nenhuma das duas jogadas é dada por 


_ 49 


PAD PAS] А) = PA) P(A) = en 


utilizando-se o fato que as duas jogadas sáo independentes. 
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1.19. Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. 


1.20. 


Determine a probabilidade de serem ambas ases, se a primeira carta (a) é re- 
posta, (b) não é reposta. 


Método 1 


Seja 4, o evento “ás na 12 extração” e А; o evento “ás na 22 extração”. 
Desejamos P(A;N As) = P(A) P(A | As). 


(a) Сото, na 1? extração, há 4 ases em 52 cartas, P(A,) = 4/52. Ese a carta é re- 
posta antes da 22 extração, então P(A, | А.) = 4/52, pois há ainda 4 ases entre 
as 52 cartas na 22 extração. Então 


/ 4 
P(A,nA) = P(A) PIAS A) = El) = És 


(b) Сото ет (a), P(A,) = 4/52. Mas, devido a ocortência de um ás na 18 extração, 
há agora apenas 3 ases entre as 51 cartas restantes, de modo que P(A, | Ay) = 3/51. 
Então 


3^ 1 
P(A,nA) = P(A) PIAS |А) = (3)(&) = gi 
Método 2 


(a) А 12 carta pode ser extraída de 52 maneiras distintas, e como há reposição, a 22 
carta também pode ser extraída de 52 maneiras distintas. Entáo, as duas cartas 
podem ser extraídas de (52) (52) maneiras distintas, todas igualmente prováveis. 

Neste caso, há 4 maneiras de extrair ás па 18 vez, e 4 maneiras de extrair 
ás na 22, de modo que o número total de escolha de dois ases é (4) (4). A proba- 
bilidade desejada é, então 


(b) A 12 carta pode ser extraída de 52 maneiras distintas, e como não há reposição, a 
22 carta pode ser extraída de 51 maneiras. As duas cartas podem, pois, ser extraí- 
das de (52) - (51) maneiras, todas igualmente prováveis. 


Neste caso, há 4 maneiras de escolher um ás na 12 extração, e 3 maneiras 
na 22 extração, de modo que o número total de escolhas de dois ases é (4) (3). А 
probabilidade desejada é, pois, 
(43) 1 


(52)(51) 221 


Da caixa referida no Problema 1.16 extraem-se três bolas sucessivamente. De- 
termine a probabilidade de as mesmas serem extraídas na ordem vermelho- 
branca-azul, (4) havendo reposição, (b) não havendo reposição. 


Seja Ку o evento “vermelha na 1? extração”, Wo o evento “branca na segunda 
extração”, B4 o evento “azul na 32 extração”. 
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(a) Havendo reposição, os eventos são independentes e 
P(R,nWanB, = Р(В;) P(W,| Ry) P(B; | Rin Ws) 
= Р(Е) P(W,) Р(Вз) 


6 4 5 PER 
6+4+5/16+4+5/16+4+5) — 225 


(b) Мао havendo reposição, os eventos são dependentes e 


P(RF,nWsnBy = P(R,) P(W, | R,) P(B; | Еп.) 
_ Б EN 5 _ «Ё 
С \6+4+5/\5+4+5/\5Б+3+5/ — 91 


1.21. Determine a probabilidade de aparecer 4 ao menos uma vez em duas jogadas 
de um dado “honesto”. 


Seja A, o evento “4 na E jogada” e А. o evento “4 na 22 jogada”. Então, 
A, О A, = evento “4 na 12 jogada ou 4 па 22 ou ambos” = 
= evento “4 ao menos uma vez”; 
desejamos P(A, UA»). 


Método 1 


Os eventos 4, е Az não são mutuamente excludentes, mas são independentes. 
Então, de acordo com (10) e (21) 


P(A UA) = P(A) + P(A) — P(A NAS) 
= Р(Аџ + P(A.) — P(A y) P(A) 


| 
аре 
+ 
mu 
| 
и 
СЭ 
==? 
bed 
ET 
SD Ea 
| 
К 
ЕЗ 


Método 2 


Р (4 ao menos uma vez) +P (4 nenhuma vez) = 1. 
Entáo,P (4 ao menos uma vez) =1 — P (4 nenhuma vez) = 
=P(não4 na 18 e піо-4 na 28) = 1 — PANA) = 1— P(A) P(AS) 


--@@-# 


Número total de casos possíveis, igualmente prováveis: 6.6 = 36, 
Número de modos de ocorrência de A; mas não de 4, = 5 
Número de modos de ocorrência de 4; mas não de A, = 5 
Número de modos de ocorrência de А; e 47 =1 


Método 3 
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Assim, o número de maneiras em que ao menos um dos eventos А; ou Az pode 
ocorrer é5+541=1.Então P(A; UA)= JL 
. 36 Р 
1.22. Uma uma contém 4 bolas brancas e 2 pretas; outra шпа contém 3 bolas 
brancas e 5 pretas. Extrai-se uma bola de cada urna. Pede-se a probabilidade 
de (a) ambas serem brancas, (Р) ambas serem pretas, (c) uma ser branca e uma 
preta. 


Seja W; o evento “bola branca da primeira urna", e W; o evento “bola branca da 
segunda urna”. 


" TRAS. тө al a mM T 
(à) PORO) РОИ) РОИ) = PW) PW) = (E) л 


l 


(в) РОИ ИИ) = PWD РОИ ИЛ) = РОР) PW) = (ei) = 3 


(c) А probabilidade desejada é 


1- PIW, nW.) - poro wi = 1-1-3 = 
¡NW 1 4 


1.23. Demonstre o Teorema 1—23, pág. 12. 


Demonstremo-lo para n 72. Os resultados se generalizam facilmente pata outros 
valores de 7t. 
Se A deve resultar em um dos dois eventos mutuamente excludentes А1, Аз, então 


А = (АпА,) U (АПА) 


Mas ANA, e А 145 são mutuamente excludentes, já que 4, e Аз о são. Então, pelo 
Axioma 3 


P(A) = PIANA) + P(ANA)) 
= P(A) РАТА) + РАЈ) PIA А») 


de acordo com (18), pág. 11. 


1.24. A uma 1 contém três fichas vermelhas e 2 fichas azuis, e a uma П contém 2 
fichas vermelhas e 8 fichas azuis. Joga-se uma moeda “honesta”. Se a moeda 
der “cara”, extrai-se uma ficha da uma I; se der “coroa”, extrai-se uma ficha 
da uma II. Determine a probabilidade de escolha de uma ficha vermelha. 

Seja R o evento “escolha de uma ficha vermelha”, enquanto que I e Il denotam, 
respectivamente, escolha da urna І e escolha da uma II. Como se pode extrair uma ficha 
vermelha tanto da urna І como da urna Il, podemos utilizar os resultados do Problema 
1.23, com A =R, Ai =I, 42 =H. Assim, pois, a probabilidade de escolha de uma ficha 
vermelha é 
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PR) = PO)PR|I) + PUDP(R|ID = (2633) TOES = E 
t C 


м. X 


| 


TEOREMA DE BAYES 
1.25. Prove o Teorema de Bayes (Teorema 1—24, pág. 13). 


Como A resulta em um dos eventos mutuamente excludentes Ay, Az, ....., An 
temos, pelo Teorema 1—22 (Problema 1.23) » 


P(A) = P(A)P(A|LA) +: + P(AQP(A|A,) = à, P(A,) P(A | Ap) 


P(AynA) _ Р(АШР(А|АЕ 
a B 


Assim, Р(А„|А) = 
E, "A9 PA | A) 


1.26. Suponhamos, no Problema 1.24, que não se conheça o resultado da jogada da 
moeda (e, consequentemente, não se saiba de qual urna vamos extrair a ficha) 
mas que saibamos que a ficha extraida é vermelha. Qual a probabilidade de 
ter sido escolhida a urna I (isto é, a probabilidade de ter aparecido “сага”)? 


Usando a mesma terminologia do Probl. 1.24, isto é, A =R, A1 - T, AFIL 
procuraremos determinar a probabilidade de a uma 1 ter sido escolhida, sabendo que a 
ficha extraída é vermelha. Aplicando a regra de Bayes com п =2, a probabilidade pro- 


curada é dada por " " 
iW oc | 
PU) PR |) 0 E + 3) O -8 


B = POPRID+PODPEID A 3 ü 2 4 | 
| 3) ES Dh) 


A chance em favor da escolha da urna 1 é, assim, de 3 para X. 


PI 


ANÁLISE  COMBINATÓRIA, CONTAGEM E DIAGRAMAS 
EM ÁRVORE 


1.27. Deve-se formar uma comissão composta de 3 membros — um representante 
dos empregados, um dos empregadores, e um do público em geral. Havendo 3 
candidatos dos empregados, 2 dos empregadores e 4 do público, quantas 
comissões diferentes podemos formar? (a) Use o princípio fundamental da 
contagem. (b) Use o diagrama em árvore. 
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(a) Podemos escolher um representante dos empregados de 3 maneiras diferentes e, 
após isso, podemos escolher um representante dos empregadores de 2 maneiras 
distintas. Há, pois, 3.2 =6 maneiras de escolher um representante dos empregados 
e um dos empregadores. A cada uma dessas possibilidades podemos associar 4 
escolhas distintas do representante do público. Assim, o número de comissões 
diferentes que podemos formar é 3.2.4 = 24. 


(b)  Denotemos por Li, Lz, L3 os 3 representantes dos empregados, por Му, Му os 
2 representantes dos empregadores, e por Py, Pa, Рз, Pa, os 4 representantes do 
público em geral. O diagrama em árvore da Fig. 1-18 mostra que há 24 possibi- 
lidades distintas de constituição de comissão. Por meio desse diagrama, podemos 
enumerar todas essas comissões, p.ex., L1 МР, LiMyP», etc. 


Fig. 1-18 


PERMUTAÇÕES 


1.28. De quantas maneiras podemos dispor em uma fileira 5 fichas de cores distintas? 


Devemos dispor as 5 fichas em 5 posições: — — — — — . A primeira posição pode 
ser ocupada por qualquer uma das cinco fichas. Isto feito, restam 4 maneiras de preen- 
cher a segunda posição. Em seguida, há 3 maneiras de preencher a terceira posição, 2 
maneiras de preencher a quarta posição, e finalmente 1 maneira de preencher a quinta 
posição. Portanto: 


a 


1.29. 


1.30. 


1.31. 


1.32, 
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Número de permutações de 5 fichas em uma fileira = 5.4.3.2.1. = 120. De 


modo geral: 
Número de permutações de n elementos em uma fileira = n(n-1)6n-2).. 1 
= n! Este é o número de permutações de п objetos, ou de arranjos de п objetos n a n; 


denota-se por , P,. ` 


De quantas maneiras 10 pessoas podem sentar-se em um banco que sô tem 
4 lugares? 

о primeiro assento pode ser ocupado de 10 maneiras diferentes; isto feito, o 
segundo assento pode ser ocupado de 9 maneiras distintas, o terceiro assento de 8 manei- 


ras distintas e o quarto assento de 7 maneiras distintas. Portanto: 
Número de arranjos de 10 pessoas 4 a 4 = 10.9.8.7. = 5.040 


De modo geral: 
Número de arranjos de п objetos distintos rar = n(n-1)...(n-rtl). 
Denotase por ,P,. Quandor = п, temos „Р, = n! tal como no Probl.1.28. 


Calcule (a) sPs, (b) sPs, (c) аР, (d) sPs. 


(a) ¿Pa = 8-1°6 = 336 (b) Py = 6552475 


(дф 5Р1 = 15 (d ¿Py = 8:2:1— 6 


Deseja-se dispor 5 homens e 4 mulheres em fila, de modo que as mulheres 
ocupem os lugares pares. Quantos sáos os arranjos possiveis? 

Os homens podem disporse de 5 P; maneiras distintas, e as mulheres de 
¿Py maneiras distintas. Logo 


Número de arranjos — = 514! = (120124) = 2529 


Quantos números de 4 algarismos podem ser formados com os 10 algarismos 
0,1,2,3,..., 8, 9, (а) admitindo-se repetições, (b) não se admitindo repeti- 
ções, (c) não se admitindo repetições e o último algarismo devendo ser zero? 
(a) O primeiro algarismo pode ser qualquer um dentre 9 (já que se exclui o zero). 
O segundo, o terceiro e o quarto podem ser qualquer um dos 10 algarismos. Podemos 
então formar 9.10.10.10 = 9.000 números. 
(b) 1º algarismo: qualquer um dentre nove (zero excluído) 
2 algarismo: qualquer um dentre nove (isto é, excluído o primeiro escolhido) 
3º algarismo: qualquer um dentre oito (isto é, excluídos o primeiro e o segundo es- 
colhidos) 
4% algarismo: qualquer um dentre sete (isto é, excluídos o primeiro, o segundo e o 
terceiro escolhidos) 
Então, podemos formar 9.9.8.7 = 4.536 números 


Outro método 
O primeiro algarismo pode ser qualquer um dos nove, e os três restantes po- 


dem ser escolhidos de Ps maneiras. Então, podemos formar 9 * gPa = 9:9+8+7 
=4.536 números. 

(c) O primeiro algarismo pode ser escolhido de 9 maneiras, o segundo de oito maneiras, © 
o terceiro de 7 maneiras. Portanto podemos formar 9* 8* 7 = 504 números. 
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1.33. 


1.34. 


1.35. 


Outro método 
O primeiro algarismo pode ser escolhido de 9 maneiras distintas, e os outros 
dois de кР» maneiras. Então, podemos formar 9 + ¿Pa = 9+ 8.7 = 504 números. 


Devemos arrumar em uma estante 4 livros de matemática, 6 de física, 2 de 
química, todos diferentes entre si. Quantos arranjos são possíveis, se (a) os li- 
vros referentes a cada assunto devem permanecer juntos, (b), só os de mate- 
mática devem permanecer juntos? 


(a) Os livros de matemática podem dispor-sc, entre si, de ,P, = 4! maneiras, os de 
física de ¿Pg = 6! maneiras, os de química de „Р„ = 2! maneiras; e Os três 
grupos de livros de Р = 8! maneiras. Então: 

Número de arranjos = 416!2!3! = 207.360. 


(b) Consideremos os 4 livros de matemática como um único livro, Temos então 9 livros, 
que podem dispor-se em gPg = 9! maneiras. Em todos esses arranjos os livros de 
matemática estão sempre juntos. Mas os livros de matemática podem dispor-se, entre 
si, de ,P, = 4! maneiras. Então: 

Número de arranjos = 9!4! = 8.709.120 


Dispõem-se em uma fileira 5 fichas vermelhas, 2 brancas, 3 azuis. Se as fichas 
de mesma cor não se distinguem entre si, quantos arranjos distintos podemos 
formar? 

Suponha-se que há M arranjos distintos. Multiplicando N pelo número de ma- 
neiras de dispor (a) as 5 fichas vermelhas entre si, (b) as duas fichas brancas entre sie (с) 
as 3 fichas azuis entre si (isto é, multiplicando N por 512131), obtemos o número de 
arranjos de 10 fichas se elas fossem todas distintas, isto é, 10! 

Então, (5!2!3)N —10! e N=10!/(5!2! 31. 


De modo geral, o número de arranjos de n objetos, dos quais n; são iguais en- 
tre si, no são iguais entre si, . . ., ny São iguais entre si, é 


onde ny + +++ — mn. 


De quantas maneiras podem 7 indivíduos sentar-se em uma mesa redonda (a) 
se eles podem sentar-se de qualquer maneira, (b) se dois determinados indiví- 
duos não podem estar juntos? 


(a) Se um indivíduo toma qualquer assento, os restantes 6 podem sentar-se de 6!= 720 
maneiras distintas, que é o número total de arranjos possíveis de 7 pessoas em círculo, 


(b) Consideremos os dois indivíduos especificados como um único indivíduo. Há então 
6 indivíduos, que podem dispor-se ao redor da mesa de 5! maneiras distintas. Mas os 
dois indivíduos especificados podem se dispor entre eles de 2 maneiras distintas, 
Então, o número de arranjos procurado é 5! 2! = 240. 


Então, o número de maneiras em que 7 indivíduos podem sentar-se em uma 
mesa redonda, com a condição de dois determinados indivíduos não ficarem juntos, 
é 720 — 240 = 480. 
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COMBINAÇÕES 


1.36. De quantas maneiras podemos dividir 10 objetos em dois grupos de 4e6 
objetos? 
É o mesmo problema do número de arranjos de 10 objetos, dos quais 4 são 
idênticos entre si, e 6 são idênticos entre si. Pelo Problema 1.34, este número é 


101 10-9:8:7 _ 
wis ct ur 4e 


O problema é idéntico ao da escolha de 4 (ou de 6) dentre 10 objetos, quando 
não interessa a ordem da escolha. Em geral, o número de escolhas de r dentre n objetos, 


chamado número de combinações de n objetos 7 ar, é denotado por „С, ou ey é 
dado por у, 
б E E) " n! пот) _ aPr 
nO, = 


E = = 


- v!(n—7)! r! T! 


1.37. Calcule (а) «Са, (b) «Cs, (с) «Са. 


; 4 
Note-se que, formalmente, ,C, = ZA us 1 desde que net 0! 


410] 


1.38. De quantas maneiras pode-se formar uma comissão de 5 pessoas escolhidas 
entre 97 


J a _ ә} 9:87:88 _ 
(5) = 0s = бр =” o a = db 


1.39. De 5 matemáticos e 7 físicos deve-se constituir uma comissão de 2 matemáti- 
cos e 3 físicos. De quantas maneiras podemos formar a comissão (a) se qual- 
quer matemático e qualquer físico pode ser incluído, (b) se determinado 
físico deve fazer parte da comissão, (c) se dois determinados matemáticos não 
devem pertencer à comissão? ` 
(a) Podemos escolher 2 matemáticos dentre 5 de 5С; maneiras. 


Podemos escolher 3 físicos dentre 7 de „С; maneiras. 
Número total de escolhas possíveis: „С„= «Cy = 10-35 = 350 


(b) Podemos escolher 2 matemáticos dentre 5 de „С, maneiras. 
Podemos escolher 2 físicos dentre 6 de Сз maneiras, 


Número total de escolhas possíveis: „С, 


(c) Podemos escolher 2 matemáticos dentre 3 de ¿€ maneiras. 
Podemos escolher 3 físicos dentre 7 de 7C maneiras. 
“Número total de escolhas possíveis: Оз = 3-35 = 105 
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1.40. Quantas saladas distintas podemos fazer com cineo espécies diferentes de 


verduras? 

Cada uma das verduras pode ser escolhida, ou não. Há, pois, duas maneiras de 
lidar com cada uma, e cada uma dessas maneiras está associada a cada uma das maneiras 
de lidar com a outra verdura, etc. Temos, pois, 2º maneiras de escolher as 5 verduras. 
Mas como este número inclui o caso em que nenhuma verdura é escolhida, o número 
procurado é 25 — 1 = 31 


Outro método 
Podem. formar a salada com uma, com duas, com três, com quatro ou com 


cinco verduras, esc» ` idas dentre as verduras que estão à nossa disposição. Então, o nú- 
mero procurado é 


б + 


+563 + 36,4565 = 5 +10+10+5+1 = 81 
De modo geral, para qualquer inteiro positivo n, 


AAC OH N = 25-1. 


1.41. De 7 consoantes e 5 vogais, quantas palavras distintas podemos formar con- 
sistindo de 4 consoantes diferentes 3 vogais diferentes? (As palavras não pre- 
cisam ter sentido) 


As 4 consoantes distintas podem ser escolhidas de тС. maneiras, as 3 vo- 
gais distintas de „Су maneiras, е as 7 letras resultantes (4 consoantes e 3 vogais) po- 
dem dispor-se entre si de „Ру = 7! maneiras. Então: 


Número de palavras = „С, * 5C3'7! = 35:10 5.040 = 1.764.000 


OS COEFICIENTES BINOMIAIS 


ny _ fn-1 nel 
1.42. Prove que (7) = ( Ф D+ (573) 


Тетоѕ 
| 
| (ү m n! _ nm—1)! _ (n-rtrin-i)! 
\т/ та) O raS oc (п т)! 
(nono)! 4 rn—) 
di rl(n—7)! Tl(n—r7)! 
(n—1)! + (#-—1)1 


rTl(n-vr—-1) * (r-1)!(n—)! 


= (5e) 
Ah o and 
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Este resultado tem a seguinte aplicação interessante. Se escrevermos os coefi- 
cientes do desenvolvimento binomial de (x + y para n —0, 1, 2,..., obteremos o 
seguinte arranjo, chamado Triángulo de Pascal: 


n=0 1 

n=1 1 Д 

ъ= 2 1 2 1 

т = 8 1 8 3 i 
n=4 1 4 6 4 1 
n=5 1 5 10 10 5 1 
n=6 1 6 15 20 15 6 1 
ete. 


Qualquer elemento de determinada linha pode ser obtido somando-se os dois elementos 
da linha anterior, à direita e à esquerda do elemento dado. Assim, 10=4 + 6, 
15210 +5, etc. 


12 
1.43. Determine o termo constante do desenvolvimento de (= +3) . 
De acordo com o teorema binomial, 
1M? 2 fg 1\ 2 E fu i 
EES = зүк( =. = 3-12 
(s Ü P k e x P k ia 
O termo constante é o termo para o qual3k—12=0, ie. Е = 4, sendo então 


12 33 0s 
(fg. == 


4 4-3:2-1 


PROBABILIDADE COM O EMPREGO 
DA ANÁLISE COMBINATÓRIA 


1.44, Uma caixa contém 8 bolas vermelhas, 3 brancas, 9 azuis. Extraindo-se ao 


acaso três bolas, sem reposição, determine a probabilidade de (a) todas as 
très serem vermelhas, (Б) todas as 3 serem brancas, (c) 2 serem vermelhas e 1 
azul, (d) ao menos 1 ser branca, (e) ser uma de cada cor, (f) as bolas serem 
extraídas na ordem vermelha-branca-azul 


(a) Método 1. 
Sejam Ry, Ra, Ёз os eventos '*vermelha na 1? extração”, “vermelha na 2% extra- 
ção”, “vermelha na 32 extração”, respectivamente. Então Ry MR2MR3 denota o 
evento “todas as 3 bolas extraídas são vermelhas”. Temos, assim, 


——d 
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P(R,nR,nR4) = P(R,) PIR: | R,) PlRs | R4 Eg) 


= GGG) = s 


"m Nº de escolhas dc 3 dentre 8 bolas sCa 14 
Probabilidade = — = = 
NO de escolhas de 3 dentre 20 bolas 20C% 285 


Método 2. 


(b) Utilizando o segundo método indicado na parte (a), 
P (todas as 3 brancas) = sa = pia 
ws 1140 
Pode-se utilizar também o primeiro método da parte (a). 
(c) P (2 vermelhas e 1 branca) = 


_ (escolha de 2 dentre 8 vermelhas)(escolha de 1 dentre 3 brancas) _ 
escolhas de 3 bolas dentre 20 


2003 = 95 
Кз, А 
(ФР (nenhuma ser branca) = 22 = 31, Então 
2003 57 
34 _ 23 
Р (ao menos 1 ser Ътапса) = 1 57 57 
(© PU de cada con = CUCOGCU _ 18 
20€ 95 1/1 8 
(f) P (extração na ordem vermelha-branca-azul) = — Pa de cada cor )= os | E $ 


utilizando (2). 


Outro Método 
P(RjnWgnBg = PR) РОР Ri) PIS Rin Wa) 


= CS) = % 


145. Em um jogo de poker extraem-se 5 cartas de um baralho de 52. Determine a 
probabilidade de (a) 4 serem ases, (b) 4 ases e 1 rei, (c) três ‘10 e 2 valetes, 
(d) um '9”, um “10”, um valete, uma dama, um rei, em qualquer ordem, (e) 3 
cartas de um naipe e 2 de outro naipe, (/) ao menos 1 ás 


(a) P (4 ases) = 469 C) 


(bj P (4 ases e 1 rei) = 
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(GC3) 409) 1 


(c) P (3 10º e 2 valetes) = - ы 
108.290 


5265 


(GC)oGC0G00G600)600 


(d) P (9, ‘10°, valete, dama, rei em qualquer ordem) — 
5205 
(4190968 * 1262) 429 


P (3 de um naipe, 2 de outro) = = 
(‚РС ре. outro) 4165 


pois há 4 maneiras de escolher o 1º naipe, e 3 maneiras de escolher o 22 


(f) Р (nenhum ás) = 805 _ 35.673 , Então, P (во menos 1 ás) = 35.673 _ 18472 


5205 — 54145" 54.145 54.145 


1.46. Determine a probabilidade de ocorréncia de trés “6 em 5 jogadas de um dada 
Representemos as cinco jogadas pelos cinco espaços — — — — —. Em cada 
espaço temos os eventos 6 ou não-6 (6). P. ex., três 6 e dois 6' podem ocorrer como 
666 66,0066 66 6, ctc. MN 
Ora, a probabilidade do resultado 6 6 6 6 6é 


P(666 66) = P(6) P(6) P(6') P(6) P(6) = 


pois admitimos a independéncia dos eventos, Analogamente, 


2 


para todos os outros resultados constantes de três 6 e dois 6. Mas há С; = 10 tais 
resultados, mutuamente excludentes. Então, a probabilidade procurada é 


Е 143/52 _ sr [11/57 _ 125 
dl «e (1) Э = arme Ө - 3.888 


De modo geral, se p = P/A) eq=1-p= PA). então, mediante raciocínio 
análogo ao acima, a probabilidade de obter exatamente x AA em n provas independen- 


tesé 


nO PERA = (Dre 


147. Uma estante contém 6 livros de matemática e 4 de física Determine a proba- 
bilidade de 3 livros de matemática em particular estarem juntos. 

Todos os livros podem ser dispostos entre si deso Pio = 10! manei- 
ras Admitindo que os trés particulares livros de matemática representem 
um livro, teremos um total de 8 livros, que podem dispor-se entre si de 
.P, = 8! maneiras Mas os três livros de matemática podem dispor-se entre 
side ,P, = 3! maneiras Então, a probabilidade procurada é dada por 

813! 


10! 5 


38 PROBABILIDADE E ESTATÍSTICA 


APROXIMAÇÃO DE STIRLING PARA n! 


1.48. Avalie 50! 
Para п grande, n! ~ V2znmne-", Assim 


501 ~ y27(50) 50506-5 = № 


Para calcular №, utilizemos logaritmos na base 10: 


Іов М = log (V1007 5050-50) 


- glor 100 г Flogs + 50 10850 — 50 log e 


log 100 + log 3,142 + 50 log 50 — 50 log 2,718 


mie w= 


(2) + 5 (0,4972) + 50(1,6990) — 50(0,43431 = 64,4836 


donde N = 3,04 X 10%, um número com 65 algarismos. 


PROBLEMAS DIVERSOS 


1.49. A e В jogam 12 partidas de xadrez, das quais 4 ganha 6, # ganha 4, 2 termi- 
nam empatadas Concordam então em jogar um conjunto de três partidas De- 
termine a probabilidade (a) de 4 ganhar todas as 3, (b) 2 partidas terminarem 
empatada" (c) A e В ganharem alternadamente, (d) B ganhar ao menos uma, 


Sejam A,, Az, Ag os eventos “A ganha” па 12, 22 c 32 partidas, respectiva- 
mente 
B,, Bs, Bs os eventos “B ganha” na 12, na 22, na 32 partidas 
Com base nos resultados observados (probabilidade empírica) 


P(A ganhar uma partida) = 


6 
12 
Р (В ganhar uma partida) = E 


(a) P (А ganhar as três partidas)= P(A, ПАПА) = P(A) PA) PA) 


00 -1 


admitindo-se que o resultado de cada partida seja independente dos resultados das 
outras. (Esta hipótese não se justificará, se qualquer um dos jogadores se deixar in- 
fluenciar psicologicamente pelo resultado obtido pelo outro.) 

(b)Em qualquer partida, a probabilidade de não-empate (i.e., A ou B ganha) é 
a=3+1=%e a probabilidade de um empate é p — 1—q = 1. Então 
a probabilidade de dois empates em 3 partidas é (v. Problema 1.46) 


э-э +а 
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(c) P (A e B ganharem alternativamente) = P (A ganhar e B ganhar e À ganhar ou B 
ganhar e А ganhar e B ganhar)- 


= P(A¡NB¿NAz) + P(B,NA¿NBy) 
P(A, P(Bj P(A,) + P(B) Р(А„) P(Bo) 


- OOG OGG) = ж 


(d) P (B ganhar ao menos uma partida) = 1 — P (B nào ganhar nenhuma) = 


Il 


= 1 — PBjnBinBg 
1 — P(B) P(B,) Р(Вз) 


ОД) = # 


1.50. А е В jogam alternadamente um par de dados. Ganha o jogo aquele que pri- 
meiro obtiver o total 7. Determine a probabilidade (a) de ganhar aquele que 
inicia o jogo, (b) de ganhar o que faz a segunda jogada. 


11 
a 
! 
VET 
volto 
ELEC 


(a) A probabilidade de obter a soma 7 com dois dados é i (Probl 1.18, Fig. 1-17). 
Se A começa o jogo, ele ganhará nos seguintes casos mutuamente excludentes, com 
as respectivas probabilidades indicadas: 


(1) A ganha na 1? jogada. Probabilidade = q. 
(2) А perde na 18 jogada, B perde, A ganha. Probabilidade = (2)05)04. 
(3) A perde, B perde, A perde, B. perde, À ganha. 

Probabilidade = (DG D- 


Assim, a probabilidade de 4 ganhar é 
5 + [ENEN SMS E 
(9« (93) +0 В. a | i 
1 sy (Gy =] PEN ME: 
É q 6) = 12086: n 


onde utilizamos o resultado 6 do Apéndice A com x — (5/6). 


(b) A probabilidade de B ganhar um jogo é, analogamente, D 


(38 + DO + = (060p 9 9] 


_ 08886 a 


1- (o n 
O primeiro a jogar tem, assim, uma chance de 6 a 5 de ganhar. Note-se que, como 


6 ы 
uw 
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1.51. 


1.52. 


1.53. 


a probabilidade de um empate é zero. Isso não seria verdadeiro se o jogo fosse limita- 
do. (v. Problemas 1.151 e 1.152), 


Uma máquina produz diariamente um total de 12.000 porcas, que acusam, em 
média, 3% de defeituosas Determinar a probabilidade de que, dentre 600 por- 
cas escolhidas ao acaso, 12 sejam defeituosas 

Das 12.000 porcas, 3%, ou 360, são defeituosas, e 11.640 não o são. Então 
00€ ra 11.8400388 


12.000 600 


Uma urna contém 5 fichas vermelhas e 4 brancas. Extraem-se sucessivamente 
duas fichas, sem reposição, constatando-se que a segunda é branca. Qual a 
probabilidade de a primeira também ser branca? 


Método 1. 
Sejam Wi, Wa os eventos “branca na 12 extração”, “branca na 22 extração”, 
respectivamente; desejamos P(W, | Wa). Essa probabilidade nos é dada por 
PWN 
Po 


(4/9)(3/8) 3 


4/9 8. 


PIW, | Wa) 


Método 2. 
Como sabemos que a segunda bola é branca, há apenas 3 possibilidades de a 


primeira ser branca, dentre os 8 casos possíveis. A probabilidade é, pois, E А 
8 


As probabilidades de um marido e sua esposa estarem vivos daqui a 20 anos 
são, respectivamente, 0,8 e 0,9. Determinar a probabilidade de que, daqui a 
20 anos, (a) ambos estejam vivos, (b) nenhum esteja vivo, (c) ao menos um 
esteja vivo. 

Sejam H e W os eventos “marido vivo daqui a 20 anos” e “esposa viva daqui a 
20 anos”, respectivamente. Então Р(Н) = 0,8, P(W) = 0,9.. Supondo-se How 
independentes (o que pode ser, ou não, razoável), 
(a) Р (ambos vivos) = Р(Нг W) = P(H)P(W) = (0,8)(0,9) = 0,72 


(УР (nenhum vivo) = PUI'nW') = P(H') PV) = (0,2)(0,1) — 0,02 


` (c) P (ao menos um vivo) = 1 — P (nenhum vivo) =1 — 0,02 = 0,98 


1.54. 


Uma secretária ineficiente coloca ao acaso п cartas em п envelopes Determi- 
nar a probabilidade de ao menos uma carta chegar ao seu destino. 

Sejam 4,, Ao, ..., Ay оз eventos “12 carta, 22 carta, ..., n-ésima carta no 
envelope correto”. Então o evento “ao menos uma carta no envelope correto é 
А ОАО UA, e desejamos determinar a probabilidade PLA, U Ag U 20А „).Се- 
neralizando os resultados (10) e (11), pág. 10 (v. Problema 1.79), temos 
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(1) P(A UAU UA) = EPA) — XP(AjnA) + E P(A¡NA¡NA1) 
= e + (IR Р(А ПАП n4,) 
onde SP(4,) é a soma das probabilidadesde A, de 1 an, Y P(A;n Aj) é a soma 


das probabilidades de A;N A; com je k de lane k > j,etc. Temos, por exemplo, o se- 
guinte: 


(2) PA) = L e analogamente Р(А„) = > 


" 

pois dos n envelopes apenas 1 está enderecado corretamente. Também 

(3) ЩА ПА) = PIA) PIAS |А) = (06) 
„ууп — 1 


pois se a 12 carta está no envelope correto então somente 1 das n—1 envelopes restantes 
está enderegado corretamente, De mancira análoga, obtemos 


U) PANAMA) = P(A) P(As A) PI'A nA) = (X 1 X23) 
etc., e finalmente, . das” a Y j 
(5) Р(АупАзг\- AA) = E JG) Е 


Mas по somatório Y P(A;NA,) há( n ) = „С: termos todos com o valor 
n 
dado por (3). Analogamente em Y, P(Ain Ajn A? há ( )- „Сз termos todos 
com o valor dado por (4). Assim, a probabilidade procurada é 


PIA UVAS UVA, = HC (Me 


ек = 14 
de modo que, рагах = —1 , 
as dl, i 
e dadas e wd 


q 


Fr 
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1.55. 


1.56. 


a 


169) 


o 


(9 


e 


(6 


0) 


Segue-se que, se n é grande, a probabilidade está muito próxima de 1 — еі = 0,6321. 
Significa isto que há boa chance de ao menos uma carta chegar ao seu destino. O resulta- 
do é notável porque a probabilidade permanece praticamente constante para todo n2 10. 
Assim, a probabilidade de ao menos uma carta chegar ao seu destino é praticamente a 
mesma, tanto para п = 10, como para п = 10.000. 


Determinar a probabilidade de n pessoas (n < 365) escolhidas ao acaso com- 
pletarem aniversário em п dias diferentes. 

Admitimos que há somente 365 dias no ano e que todos os dias são igualmente 
prováveis (hipóteses que, na realidade, não são totalmente satisfeitas.) 

A primeira das п pessoas tem dia de aniversário com probabilidade 
365/365 = 1. Então, se a segunda deve ter dia de aniversário diferente, este deve ocorrer 
em um dos 364 dias restantes. Assim, pois, a probabilidade de a 22 pessoa fazer anos em 
dia diferente do aniversário da: primeira é 364/365. Analogamente, a probabilidade de a 
terceira pessoa fazer anos em dia distinto dos dias de aniversário da 12 e da 22 pessoa 
é 363/365. Finalmente, a probabilidade de a enésima pessoa fazer anos em dia diferente 
dos dias de aniversário de todas as outras é (365 — n +1)/365. Temos, assim, 


365 364363 365 n L1 
365 365 305 365 


"EC! E Lh" co 
= (1 as) 2) (1 365 / 


No Problema 1.55 determine quantas pessoas são necessárias para tornar a 
probabilidade inferior a 1/2. 
Denotando a probabilidade por p e tomando logaritmos naturais 


1 | 2 2 —1Y 
inp = E = 2 densa ee E 
р m(1 ps) * m(1 $5) + En (1 E ) 


V 
Mas, pelo cálculo (Apéndice A, fórmula 7), sabemos que 


P (todos os n aniversários diferentes) — 


2 3 
P NS. 
1-3) 5-x-1--—--e 
inc x)--x 7 3 
de modo que (1) pode escrever-se 
pes us w: tH] ipB-2-:- te) 4 
365 2 (365) 
Levando em conta que, para n = 2,3... (Apéndice A, fórmulas 1 e 2), 


. n(i — 1) Qn - 1) 


A CE E 


024 ta- p= 2 


obtemos para (3) 
n(n-1) nm-1Qn-1) 
inp =- ——— 5 — em 
P 730 

Para п pequeno comparado com 365, digamos п < 30, o segundo termo e os termos de 
ordem superior à direita de (5) são desprezíveis' em face do primeiro termo, de modo 
que se tem uma boa aproximação com. 

is тп – 1) 

10—730 


Parap => inp =-1n2=- 0,693. Temos assim 


пп — 1) 


739 = 0693 ou nº-n-506=0 .ou (п – 23) (п + 22) =0 
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de modo que n = 23. Concluímos, pois, que se n é maior do que 23, as chances são em 
favor de pelo menos duas pessoas fazerem anos no mesmo dia. 


Problemas Suplementares 


CONJUNTOS 


1.57. 


1.58. 


1.59. 


1.60. 


1.61. 


1.62. 


1.63. 


1.64. 


165. 


Seja А o conjunto de todos os números naturais entre 5 e 15, que são pares. Descreva 4, 
(a) pelo método da listagem, (b) pelo método da propriedade. 


Seja А = (x | -30+2= Q B = {ж | a? & 16). Determine se ACBou 
não. Е 
Prove que, para qualquer conjunto А, se tem АС А. 


Discuta a veracidade ou falsidade das seguintes afirmativas: (a) Se A e B são dois conjun- 
tos quaisquer, então ou ACB, ouA 2B,ou A = В. (b) Sex e y süo dois nümeros 
reais, então ou x X y, ou Y >Y, ou t—y. 


Prove que qualquer subconjunto de conjunto vazio deve ser o conjunto vazio. 


Беја Го conjunto ou classe de todos os conjuntos que náo sáo elementos de si próprios. 
(a) Prove que se cf € Af, então JEc)4b) Prove que se -j g cj então of Ef . Este 
paradoxo é chamado paradoxo de Russell. 


OPERAÇÕES COM CONJUNTOS, DIAGRAMAS DE VENN, 
TEOREMAS SOBRE CONJUNTOS 


Seja U = (1, 2,3, 4, 5) um universo e suponhamos que А = (1, Б}, В = {2,5,3), 
C = (4,2) sejam subconjuntos de U . Determine 


(a) A U (BUC) (b) (AUB) U C, (e) AN(BLO), (d) (A nB) u (ANC), 
(e) A^n(B'naC?, (P) (AUB) – (АЧС), (о) (An Cyr o B, (h) A — (B'uC). 


Seja И о conjunto de todos os inteiros ndo negativos e consideremos os subconjuntos 
A = {к |= é inteiro prrl<xe 6); e n fæ = é primo, 0c «4j . 
Determine 


(a) AUB, (b) An B, (е) A'nB', (d) А В, (e) B—A, (f) (A — В) u (BA). 


Use um diagrama de Venn para esboçar cada um dos seguintes conjuntos: 
(a) AN(BUC) (e) A'n Gn cy (д A! — (Bu CY 
(b AU(BNC) (d) A — (BNC) 
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1.66. 
1.67. 


1.68. 


1.69. 


1,70. 


172 


1.73. 


1.74. 


É (A — By = A' — B'? , Justifique sua resposta. 
Prove (a) o Teorema 1-2, pág. 4, (b) o Teorema 1-3, pág, 4, (с)о Teorema 1-4, pág. 4. 


(a) Prove a segunda lei de De Morgan, Teor. 1-12b, pág. 5, c (b) ilustre sua resposta por 
meio de um diagrama de Venn. 


Generalize as primeira c segunda leis de De Morgan para um nümero qualquer de con- 
juntos. (v. Probl. 1.7). 


Ilustre o princípio da dualidade, mediante referéncia aos teoremas das págs. 4 e 5. 


. Prove que(A — B) URB = А se e somente ѕе с A; ilustre por meio de um diagrama 


de Venn. 


Prove, ou não, que,se A — B = (), então А = В. 


Prove que AU B = [A-(ANB) UÍB-(A ПВ) U (An В) e ilustre por meio de 
um diagrama de Venn. 


Generalize o resultado do Probi. 1.9. 


EXPERIMENTOS ALEATÓRIOS, ESPACOS AMOSTRAIS, EVENTOS 


1.75. 


176. 


Descreva um espaço amostral para cada um dos seguintes experimentos aleatórios: 
(a) 3 jogadas de uma moeda, (Р) número de fumantes em um grupo de 500 adultos de 
sexo masculino, (c) jogar uma mesma moeda até que apareça coroa, (d) número de cha- 
mada: а um tronco telefónico, (e) número de partículas nucleares que entram em um 
contador Geiger, (f) jogada de uma mocda e um dado. 


Um experimento consiste na jogada de uma moeda e de um dado. Seja 4 o evento “cara 
aparece primeiro” na jogada da moeda, e B o evento “3 ou 6 aparece na jogada do 
dado”; explique o significado de. 

(a) А’, (b) B', (c) АПВ, uh АЛТ, (o А-В, (MBA, (g) A'UB. 


4 


TEOREMAS SOBRE PROBABILIDADES 


1.77. 


1.79. 


1.80. 


Complete a demonstração do Teor. 1 .14b provando (sem diagrama de Venn) que 
AUB=AU[B-(ANB)] 


onde 4 e В — (ANB) são mutuamente excludentes. 


. Demonstre o resultado (11), pág. 10. 


Generalize os resultados (10) e (11) da pág. 10, provando, assim, O resultado (1) do 
Problema 1.54, pág. 40. 


Prove que P(A'UB') = 1— P(AnB). 
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CÁLCULO DAS PROBABILIDADES 


1.81. 


1.82. 


1.83. 


1.84 


1.85. 


Determine (ou estime) a probabilidade p de cada um dos seguintes eventos: 

(a) Um rei, um ás, um valete de paus Ou uma rainha de ouros na extração de uma carta 
de um baralho normal. 

(b) Aparecimento do total 8 na jogada de dois dados. 

(c) Extração de uma peça perfeita, se, em 600 peças previamente examinadas, foram 
encontradas 12 defeituosas. 

(d) Aparecimento de 7 ou 11 em uma jogada de um par de dados, 

(eJÃo menos uma cara em três jogadas de uma moeda. 


Um experimento consiste na extração sucessiva de três cartas de um baralho normal. 
Sejam A, o evento “rei na 1% extração”, Ay “rei na 22 extração”, Аз “rei na 38 ex- 
tração”. Explique, em palavras, o significado de: 

(a) P(A NAS, (b) PIAUAS), (с) P(ASUAS, (d) Р(Ауп As n AS), 


(e) PANA) U (45043)]. 


Extrai-se, ao acaso, uma bola de uma caixa que contém 10 bolas vermelhas, 30 brancas, 
20 azuis e 15 laranja. Determine a probabilidade de extração de uma bola (a) laranja ou 
vermelha, (b) náo-vermelha ou azul, (c) náo—azul, (d) branca, (e) vermelha, branca ou 
azul. 


No Probl. 1.83, extraem-se, sucessivamente e com reposição, duas bolas. Determine a 
probabilidade de que (a) ambas sejam brancas, (b) a primeira seja vermelha e a segunda 
branca, (c) nenhuma seja laranja, (d) ambas vermelhas, ou ambas brancas, ou vermelha 
e branca (em qualquer ordem), (e) a segunda seja não-azul, (f) a primeira seja laranja, 
(g) ao menos uma seja azul, (й) ao menos uma seja vermelha, (i) a primera seja branca, 
mas não a segunda, (/) apenas uma vermelha. 


Resolva o Probl. 1.84, supondo que não haja reposição após a primeira extração. 


PROBABILIDADE CONDICIONAL E EVENTOS INDEPENDENTES 


1.5. 


187. 


1.88. 


Las. 


1.90. 


Uma caixa contém 2 bolas vermelhas e 3 azuis. Extraem-se ao acaso duas bolas, sem re- 
posição. Determine a probabilidade de serem (a) ambas azuis, (b) ambas vermelhas, 
(c) uma vermelha e uma azul. 


Determine a probabilidade de extração de 3 ases de um baralho usual de 52 cartas, 
(a) com reposição, (b) sem reposição. 


Se, em uma família com dois filhos, 10 menos um deles é menino, qual a probabilidade 
de o outro ser também menino? 


Mostre que a probabilidade condicional, tal como definida por (17)na pág. 11, satisfaz 
os axiomas d« probabilidade (pág. 9) e, portanto, os teoremas sobre probabilidade. 


Prove que se P(A) > P(B) |елійо P(A | B) > P(B|A). 
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1.91. 


1.92. 


1.93. 


1.94, 


Se A é independente de B, prove que (a) A é independente de B”, (b) A” é indepen- 
dente de B’. 


Se A, B, C, são eventos independentes, prove que (4) A e BUC, (b) Ae B'YC, 
(c) A e B — C, sáo independentes. 


Sejam A, o evento “n? ímpar no primeiro dado”, A, “nº ímpar no segundo dado”, 
Ag' о evento “total ímpar em ambos os dados". Mostre que Ai, Ay; Ap, Ag; А;, Аз 
são independentes mas que А 1, 43, 43 não o são. 


A caixa I contém 3 bolas vermelhas e 5 brancas, e a caixa II, 4 vermelhas e 2 brancas. 
Extrai-se ao acaso uma bola da primeira caixa e coloca-se na segunda, sem observar а 
cor. Extrai-se então uma bola da segunda caixa. Qual a probabilidade de ser branca? 


TEOREMA (REGRA) DE BAYES 


1.95. 


Uma caixa contém 3 bolas azuis e 2 vermelhas, e outra caixa contém2 bolas azuis e 3 
vermelhas. Extrai-se ao acaso uma bola de uma das caixas: é azul. Qual a probabilida- 
de de ter sido extraída da primeira caixa? 


. Em uma joalheria, cada um de três armários idénticos tem duas gavetas. Em cada gaveta 


do primeiro armário há um relógio de ouro, Em cada gaveta do segundo armário há um 
relógio de prata. Em uma gaveta do terceiro armário há um relógio de ouro, enquanto 
que na outra gaveta há um relógio de prata. Escolhido ao acaso um armário, e aberta 
uma das gavetas (também aleatoriamente), verifica-se conter um relógio de prata. Qual 
a probabilidade de a outra gaveta do armário escolhido conter um relógio de ouro? 


. A Urna І contém 2 bolas brancas e 3 pretas; a Urna П, 4 brancas е 1 preta; a Urna Ш 


3 brancas e 4 pretas. Escolhe-se uma urna ao acaso e extrai-se uma bola: é branca. Qual 
a probabilidade de ter sido escolhida a primeira urna? 


ANÁLISE COMBINATÓRIA, CONTAGEM, DIAGRAMAS EM ÁRVORE 


1.98. 


1.99. 


Joga-se uma moeda três vezes. Construa um diagrama em árvore para determinar as 
diversas possibilidades de resultados. 


De um baralho usual de 52 cartas extraem-se 3 ao acaso, sem reposição. Use um diagra- 
ma em árvore para determinar o número de maneiras de extração (a) de uma carta de 
ouros, uma de paus e uma de copas em sequência, (b) duas cartas de copas e, em segui- 
da, uma carta de paus ou de espadas. 


1.100. De quantas maneiras podemos colocar 3 moedas distintas em 2 bolsas diferentes? 


PERMUTAÇÕES 


1.101. Calcule (a) ¿Po, (b) 7Ps, (c) 10P3. 


1.102. Para que valor den ё , ,,P4 = ,P,? 
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1.103. De quantas maneiras podem 5 pessoas sentar-se em um sofá que dispõe apenas de 3 
lugares? 


1.104. De quantas maneiras podemos dispor 7 livros em uma prateleira se (a) qualquer arran- 
— јо é possível, (b) 3 livros determinados devem sempre estar juntos, (c) 2 livros deter- 
minados devem sempre ocupar as extremidades? 


1.105. Quantos números de 5 algarismos diferentes podem ser formados com os algarismos 
1, 2,... , 9, (a) se os números devem ser ímpares, (b) se os dois primeiros algarismos 
devem ser pares? 


1.106. Resolva o Probl. 1.105, admitindo repetições dos algarismos. 


1.107. Quantos números distintos de 3 algarismos podem formar-se com três 4, quatro 2 
e dois 3? 


1.108, De quantas maneiras podem 3 homens e 3 mulheres sentar-se a uma mesa redonda se 
(a) não há nenhuma restrição, (b) duas determinadas mulheres não devem ficar juntas, 
(c) cada mulher deve estar entre dois homens? 


COMBINAÇÕES 

1.109. Calcule (а) ¿Cy (Б) «С, (6) оС». 

1.110. Para que o valor den é 3* „,,Су = 1º „О? 

1.111. De quantas maneiras podemos escolher 6 questões dentre 10? 


1.112.De quantas maneiras podemos escolher, dentre 8 homens e 6 mulheres, uma comissão 
composta de 3 homens e 4 mulheres? 


1.113. Dentre 6 homens, 8 mulheres, 4 meninos e 5 meninas, de quantas maneiras podemos 
escolher 2 homens, 4 mulheres, 3 meninos e 3 meninas (a) se não houver qualquer res- 
trição, (b) se determinado homem e determinada mulher devem fazer parte do grupo? 


1.114. De quantas maneiras podemos repartir 10 pessoas em (а) dois grupos de 7 e 3 pessoas, 
(b) três grupos de 5, 3 e 2 pessoas? 


1.115.De um grupo de 5 estatísticos e 6 economistas deve-se formar uma comissão compos- 
ta de 3 estatísticos e 2 economistas. Quantas comissões podemos formar (a) se não há 
qualquer restrição, (b) se dois estatísticos determinados devem integrar a comissão, 
(c) determinado economista não deve pertencer à comissão? 


1.116. Determine quantas (a) combinações e (b) permutações de 4 letras podem formar-se com 
as letras da palavra Tennessee. 


COEFICIENTES BINOMIAIS 


11 
1.317. Calcule (а) Ca, (b) G ) (c) (sC3GC3)/13€s- 
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1.118. Desenvolva (а) (x + y)S, (b) (x — y)!, (e) (x — 2—1)5, (d) (x2 + 2). 


9 
1.119. Determine o coeficiente de x em ( "IR 2) E 


1.120. Mostre que (a) (5) + (A + de ale a 4% (5) = qn 


o О) = o 


п n 
1.121.Prove que (a) 3 ЈС) = т.2"-1, (b) 5 (—1))-1106) = 0. 
je j=1 


PROBABILIDADE COM O EMPREGO DA ANÁLISE COMBINATÓRIA, 


1.122, Determine a probabilidade de obter o total 7 (a) uma vez, (b) ao menos uma vez, (c) 
duas vezes, em duas jogadas de um par de dados. 


1.123.De um baralho usual de 52 cartas extraem-se duas cartas sucessivamente. Determine a 
probabilidade de: (2) a 12 carta não ser o 10 de paus ou um ás; (b) a 12 carta ser um ás, 
mas a segunda náo; (c) ao menos uma carta ser ouros; (d) as cartas náo serem do mesmo 
naipe; (е) no máximo uma figura (valete, rainha, rei); (f) a 28 carta não ser uma figura; 
(g) a 22 carta não ser uma figura, sabendo que a 1? extração deu figura; (Л) as cartas 
serem ambas figuras ou ambas espadas. 


1.124. Uma caixa contém 9 fichas numeradas de 1 a 9. Extracm-se três sucessivamente. Deter- 
minar a probabilidade de serem, alternadamente, ímpar-par-impar, ou par-Ímpar-par. 


1.125. As chances a favor de A contra B em jogo de xadrez são 3:2. Em 3 partidas (a) quais são 
as chances de A ganhar ao menos duas partidas, (b) de A perder para B as duas primeiras 
partidas? 


1.126. No jogo de bridge cada um de 4 jogadores recebe 13 cartas de um baralho usual de 52. 
Determine a probabilidade de um dos jogadores (digamos, o mais velho) receber (a) 7 
ouros, 2 paus, 3 copas e 1 espadas; (b) um naipe completo. 


1.127. Uma urna contém 6 bolas vermelhas e 8 azuis. Extraem-se cinco ao acaso, sem reposi- 
ção. Determinar a probabilidade de serem 3 vermelhas e 2 azuis. 


1.128. (a) Determine a probabilidade de obter a soma 7 em ao menos uma dentre três jogadas 
de um par de dados. (b) Quantas jogadas são necessárias para que a probabilidade em 
(a) seja maior do que 0,95? 


1.129. Extraem-se três cartas de um baralho usual de 52 cartas. Determinar a probabilidade de 
(a) serem todas trés do mesmo naipe, (b) saírem ao menos dois ases. 


1.130, Determinar a probabilidade de que, em 13 cartas escolhidas ao acaso, 9 sejam de um 
mesmo naipe. 
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APROXIMAÇÃO DE STIRLING PARA п! 

1.131. De quantas maneiras podemos escolher 30 indivíduos em um grupo de 100? 
1.132. Mostre que „С, = 2ºn/ywn. aproximadamente, para grandes valores de л. 
1.133. Determine o erro percentual na fórmula de Stirling para n= 10. 


1.134. Obtenha uma aproximação para o resultado do Probl. 1.51. 


PROBLEMAS DIVERSOS 


1.135. Um espaço amostral consiste de três pontos amostrais com as probabilidades associa- 
das dadas por 2p, p? е 4p— 1 Determine o valor de p. 


1.136. Prove que, se A C B'entào АПВ = Ø. 

1.137. Prove que А — (4n B) = ANP’. 

3-138. Quantas “palavras” podemos formar com 5 letras, (a) se todas as letras sáo diferentes, 
(b) se 2 letras são idénticas, (c) se todas as letras são distintas mas duas delas em par- 


ticular não podem ser adjacentes? 


5 139. Escolhem-se ao acaso 4 inteiros entre O c 9 inclusive. Determine a probabilidade de 
— (a) serem todos diferentes, (b) não haver mais de uma repetição. 


1340. Joga-se repetidas vezes um par de dados. Determinar a probabilidade de aparecer a 
soma 11 pela primeira vez na sexta jogada. 


1.341. No Probl. 1.140, qual é o menor número de jogadas para que a probabilidade de apare- 
cer 11 pela primeira vez seja maior do que (a) 0,5, (b) 0,95? 


1.342 Discuta a seguinte afirmativa: Náo há tal coisa como uma moeda "honesta", pois em 
qualquer número de jogadas é extremamente improvável que o número de "caras" seja 
igual ao número de “coroas”, 


1.143 Suponha que, em 500 jogadas de uma moeda, foi observada шпа segiiéncia de 24 jo- 
gadas com o resultado “cara”. Pode a moeda ser considerada “honesta”? Explique. 


3.344. Prove que, para quaisquer eventos Ay, do, ..., Ay 
P(A UAU UA) E P(A) + PIA) + >=: + P(A) 
3345 Na jogada de um par de dados, a soma das faces que ficam para cima pode ser 2, 3, 
...,12. Poderíamos atribuir a probabilidade 1/11 a cada um desses resultados? Expli- 
que. 


1.34&. No jogo de poker, determino a probabilidade de obter (a) um royal ип (10, valete, da- 
ma, rei e ás de um mesmo naipe); (Б) um fuil house (três cartas de um dado valor facial, 
duas de outro, como, p. ex., três 10 e dois valetes, etc.); (c) todas as cartas diferentes; 
1d) 4 ases. 


У 
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1.147.A probabilidade de um indivíduo atingir um alvo é à. Se cle deve atirar até atingir o al- 
vo pela primeira vez, determine a probabilidade de serem necessários cinco tiros. 


1.148. (a) Uma prateleira tem 6 compartimentos separados. De quantas maneiras podemos co- 
locar nos compartimentos 4 bolinhas indistinguíveis? (b) Faça o problema supondo n 
compartimentos e r bolinhas. (Este tipo de problema surge na Física em relação à esta- 
sística de Bose-Einstein). 


1.149. (a) Uma prateleira contém 6 compartimentos separados. De quantas maneiras podemos 
distribuir 12 bolinhas indistinguíveis pelos compartimentos, de modo que nenhum deles 
fique vazio? (b) Faça o problema supondo n compartimentos e 7 bolinhas, com 7 >n. 
(Este tipo de problema surge na física em relação à estatística de Fermi-Dirac. ) 


1.150. Um jogador de poker tem as cartas 2, 3, 4, 6, B, e deseja descartar о 8 e substituí-la por 
outra carta, que ele espera seja 5, a fim de completar um straight. Qual sua probabilida- 
de de sucesso, admitindo que os outros trés jogadores tenham (a) um 5, (b) dois 5, 
(c) trés 5, (d) nenhum 5?. Pode-se resolver o problema supondo-se desconhecido o nú- 
merode 5 em poder dos outros jogadores? Explique. 


1.151. Faça o Problema 1.50 se o número de jogadas é limitado a três. 
1.152. Generalize o resultado do Problema 1.151. 


1.153. Determine a probabilidade de, no jogo de bridge, (a) dois, (b) três, (c) todos os jogadores 
terem um naipe completo. 
п a [E /n—k 
1.154.Proye que ( ) as ( Y ) e dê uma interpretação combinatória. 
ST, de 


i=o \7/\т—7 


(Sugestão: Considere (1 + x)" (1 + ж)" к e determine o coeficiente de x/ no produto.) 


2 y 2 
1.155.Prove que ( Ao ы ( % + BM p awik RA e dê uma interpretação combi- 
Su |0 1 n 


natória. 
1.156, Prove que a probabilidade de a secretária do Problema 1.54 colocar exatamente a cartas 
2 1 Ze 
nos envelopes corretos é dada por — Y Aa (Sugestão: Denotando por р„(@), 
a! Za fe | 
1 


а probabilidade desejada, mostre que Pala) = Pu-o (0) e use então o resulta- 
do do Probl. 1.54). es 


Variáveis Aleatórias e Distribuições 
de Probabilidade 


VARIÁVEIS ALEATÓRIAS 


Suponhamos que a cada ponto de um espaço amostral se atribua um número. 
Teremos então uma função definida no espaço amostral Esta função é chamada 
»arizvel aleatória (ou variável estocástica), ou, mais precisamente, função aleatória 
fow função estocástica) Denota-se em geral por uma letra maiúscula X, Y,... . Em 
geral, uma variável aleatória tem algum significado físico, geométrico, ou outro 


qualquer 


EXEMPLO 2.1. Jogando-se uma moeda duas vezes, o espaço amostral é of = (HH, HT, TH, TT). 


Sex X o número de “caras” que aparecem. A cada ponto amostral podemos associar um núme- 
=> para X, tal como se vé na Tábua 2-1. Assim, p.ex., no caso HH (1.6, 2 caras), X = 2, enquanto 
mus para TH (1 cara) X= 1. Vê-se que X é uma variável aleatória. 
Tábua 2-1 
Ponto Amostral 


x 


Note-se que para este mesmo espaco amostral, poderíamos definir muitas outras variáveis 
aleztórias, p.ex., o quadrado de número de “caras”, e o número de “caras” menos o número de 
Pessoas”, сіс. 

Uma variável aleatória que toma um número finito, ou um número infinito 
emumerável de valores, é chamada variável discreta, ao passo que uma variável 
mestória que toma um número infinito (não-enumerável) de valores, ё uma variável 
estória contínua. 
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DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE 


Seja X uma variável aleatória discreta, с sejam 21, Va, 2s. . ., Os valores que ela 
pode tomar, dispostos em ordem crescente de magnitude Suponhamos também 
atribuídas a esses valores probabilidades dadas por 


Р(Х = а) = fur) k 


É conveniente introduzir aqui a função de probabilidade, também designada 
distribuição de probabilidade, dada por 


P(X=2) = fa) (2 


Para х = xy (2) se reduz a (1), enquanto, para os demais valores de x, f(x) = 0. 
De modo geral, / (x) ё uma função de probabilidade se 


l. fa) 20 


2 €ix-i 


Eu i (1) 


onde o somatório em 2 cobre todos os valores possíveis de x. O gráfico de f (х) ё 
chamado gráfico de probabilidade. 


EXEMPLO 2.2. (a) Determine a função de probabilidade correspondente à variável aleatória do 
Exemplo 2.1, e (b) construa o gráfico de probabilidade. 
(a) Supondo a moeda “honesta”, temos 


ca HE li = É А zy% 
P(HH) = q РНТ) = q PITH) = 3 PUT) = 4 


Р(Х = 0) = PITT} i. 


P(HTUTH) = Р(НТ) + P(TH) = 


"P 
Ds] 
Ш 

- 
[i 


Р(Х = 2) = P(HH) = i 


A função de probabilidade é, pois, dada pela Tábua 2 

(b) Pode-se construir o gráfico de probabilidade utilizando-se o gráfico em barras 
(Fig 2-1), ou o histograma (Fig. 2-2). No gráfico em barras a soma das ordenadas é 
1, enquanto que no histograma, a soma das áreas retangulares é 1. No caso do histo- 
grama, podemos supor contínua a variável X, p.ex., X — 1 significa que X está entre 
0,5 e 1,5. 
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Ла) 


o 1 2 


Fig. 2-1. Gráfico em barras 


Fig. 2-2. Histograma 


FUNCÓES DE DISTRIBUICAO PARA VARIÁVEIS ALEATÓRIAS DISCRETAS 


A função de distribuição acumulada, ou abreviadamente, função de distribui- 
ção, de uma variável aleatória X é definida como 


P(X<a) = F(x) (3) 


onde х é um nümero real, ie, —%0 < v < =, Pode-se obter a função de distribui- 
ção a partir da função de probabilidade observando que 


F(a) = P(X <a) = P (4) 


onde o somatório à direita cobre todos os valores de и para os quais и < q. Inversa- 

mente, a função de probabilidade pode ser obtida a partir da função de distribuição. 
Se X toma apenas um número finito de valores 21, 2», ..., nentão a função 

de distribuição é dada por 
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0 —» <a <a 
f(x) << 

Fla) = | Flor) + Қаз) La «X < Us (8) 
[fes hf) асас 


EXEMPLO 2.3. (a) Determine a função de distribuição da variável aleatória do Exemplo 2.2. 
(b) Trace o gráfico. 
(a) A função de distribuição é 


f 2<0 

4 0 rcl 

Fi) = 44 sa 
E 1<2<2 
JN 2<1< ww 


(b) O gráfico de F é exibido na Fig. 2-3. 


Notem-se os seguintes F(z) 
fatos a respeito da função de 
distribuição acima (os quais, 
de resto, são válidos de modo 
geral) : | 

1. Os valores dos saltos | | ha 

em 0, 1, 2 são з р 
1, 4, i que são pre- | 
cisamente os valores | 
das ordenadas па 2 | 
Fig. 2-1. Este fato | 
permite obter а fun- 1 
ção de probabili- | 1 
dade a partir da dis- ad 
tribuição de probabi- 
lidade. 
2 Em virtude de sua Fig. 2-3 
aparéncia,, о gráfico 
da Fig 2-3 costuma 
ser chamado de função escada ou função degrau. O valor da função em um 
ponto inteiro do argumento é o valor mais alto (e não o mais baixo) do 
degrau. Assim, O valorem 1 ё $ enão į. Matematicamente, ex prime-se 
tal fato dizendo-se que a função de distribuição é contínua à direita nos 
pontos 0, 1, 2. 


VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE 55 


3. Na medida em que procedemos da esquerda para a direita (i e , “subindo a 
escada”) a função de distribuição permanece a mesma, ou aumenta, to- 
mando valores de O a 1. Traduz-se matematicamente este fato dizendo-se 
que a função ё monotonicamente crescente. 


DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA 


Se X é uma variável aleatória continua, a probabilidade de X tomar um 

determinado valor ё, em geral, zero. Não se pode, pois, definir uma função de pro- 
Sabilidade contínua da mesma maneira como o fizemos no caso de variável discreta 
fsz 38) Para chegarmos a uma definição de distribuição de probabilidade conti- 
mua. notemos que o que tem sentido é falar-se da probabilidade de X estar com- 
mreendido entre dois valores diferentes. 
EXEMPLO 2.4. Escolhido ao acaso um indivíduo de um grande grupo de adultos do sexo 
mascalino, a probabilidade de sua altura ser de exatamente 68 polegadas (i.e., 68,000 ... pole- 
22325) é zero. Mas existe uma probabilidade finita, maior do que zero, de X estar entre 67,500 
268,500 ... polegadas, p.ex. 

Estas idéias, e a analogia das Propriedades 1 e 2, pág 52, nos levam a postular 


= existência de uma função f (x) tal que 
1 fix) > 0 


2 f Қа) а = 1 
2 é a afirmativa matemática do fato de que uma variável aleatoria real deve 


sestemente estar compreendida entre —оо е co. Definimos então a probabilidade de 
X estar entre 2 e b por 


Pla<X<b) = Siro de (6) 


Pode-se mostrar que tal definição satisfaz os axiomas de probabilidade, pág. 9. 

Uma função f (x) que satisfaz as condições supra é chamada função de pro- 
Sebiiiade, ou distribuição de probabilidade para uma variável aleatória contínua; 
costuma-se, entretanto, designá-la mais frequentemente por função de densidade 
de probabilidade, ou simplesmente por função de densidade. Qualquer função que 
samsfaça as propriedades 1 e 2 será automaticamente шпа ifunção: de densidade, e 
Š se podem deduzir as probabilidades desejadas, utilizando-se (6). 


EXEMPLO 2.5. (4) Determine a constante c de modo que a função 
ох? 0<x<3 
fi) = T 
a 0 em caso contrário 


\ 
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seja uma função de densidade, e (5) calcule Р(1 < X«2) 
(a) Como f (x) satisfaz a Propriedade 1 parac Z2» 0,deve satisfazer a Propriedade 2 para 
ser uma função de densidade. Ora 


= 3 з |з 
f fix) da = f code = с = Ye 
Es ^ 3 |» 
e como isto deve ser igual a 1, temos c — 1/9. 
2 3 |2 
Ф) = f leg uv le A Le 
Р «тз | Ө" = = gr), 27 27 27 


No caso de f (x) ser contínua — о que será sempre admitido, a menos que se 
declare expressamente o contrário — a probabilidade de X ser igual a determinado 
valor é zero. Em tal caso, podemos substituir um ou ambos os sinais < em (6) por 
<. Assim, no Exemplo 2.5, 

P(1<X<2) = Pü«X«2) = PA<X<2) = Pa cX«2) = Е 
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Por analogia com (4), pág 59, definimos a função de distribuição F (x) para 
uma variável aleatória contínua por 


Fa) = Р(Х<а) = P(-=<X<2) = ў. ftu) du (7) 


Nos pontos de continuidade de f (х), € em (Т) pode ser substituído por < 


EXEMPLO 2.6. (a) Determine a função de distribuição da variável aleatória do Exemplo 2.5. 
(b) Use o resultado de (a) para calcular P(1 <x <2) 


(a) Temos E 
Fa) = Р(Х<а) = f Fu) du 


Se х «0 então F(x) = 0. Se 0 << 8 então 
z +r as 
= E" Ig ex E 
Fe) = f fu) du = Í guide 27 


Se х Z8 então 


Fla) = Sra du + So ro au = fion T so du = 1 


Assim, a função de distribuição desejada é 
0 .*<0 
Fa) = 0/27 0<:<3 


{1 z 28 
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Note-se que F (x) cresce monotonicamente de O a 1, tal como se exige para uma função 
de distribuição. Note-se também que F (x), neste caso, é contínua. 


(b Temos ысу» = P(X«2)— PX<) 
= FQ- FQ) 
B VI xd 
"H 2" 


сото по Ехетріо 2-5. 


A probabilidade de X estar entre x e x + Ax ё dada por 


т+Ат 
P(r«X«scax) = f EN (8) 
de modo que, para Ax pequeno, temos, aproximadamente, 
Р(к<Х<т+Ах) = f(v)ax (9) 
Уёзе também de (7) (diferenciando ambos os membros) que 
El) sm 
“ш fa) (10) 


em todos os pontos de continuidade de f (x), i e., a derivada da função de distribui- 
cão é a função de densidade. 


REGRA DE LEIBNIZ 
Para obter (10) utilizamos o fato, já conhecido do cálculo, de que 
ES, f(udu = fx) (11) 
Trata-se de um caso especial da regra de Leibniz para diferenciação de uma integral: 
aalr) ааг) das da 
Жа Fada = f E qu + Fasz) 2) SE — Е(а(а), 2) DO (22 


“из dk 


onde as, а, eF são supostas diferenciáveis em relação a x. 


INTERPRETAÇÕES GRÁFICAS 


Se f (x) € a função de densidade para uma variável aleatória X, podemos re- 
presentar у= f (x) graficamente por uma curva, tal como na Fig 2,4, Como f(x) > 0 
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a curva não pode estar abaixo do cixo dos xx. A área total delimitada pela curva e 
pelo eixo dos хх deve ser 1, em virtude da Propriedade 2, pág. 55. Geometricamen- 
te, a probabilidade de X estar entre a e b,ie,P(a < X < b)é então dada pela 
área sombreada na Fig. 2.4. 


He) 


Fig. 25 


F(x) = Р(Х < х) е uma função monotonicamente 
crescente, que cresce de O a l,e é representada por uma curva tal como na Fig. 2.5. 


DISTRIBUIÇÕES CONJUNTAS 


Generalizam-se facilmente as idéias acima ao caso de duas ou mais variáveis 
aleatórias. Consideremos o caso típico de duas variáveis — discretas ou contínuas. 
Introduzem-se facilmente modificações no caso de uma variável ser discreta e a 
outra contínua 
1. Caso Discreto И 

Se X e Y são duas variáveis aleatórias discretas, definimos a função de 

probabilidade conjunta de X e Y.por 


PIX =z, Y=y) = f(x,y) (18) 
onde 1. f(z,y) > 0 
2 E > 10,4) =1 
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i.e., a soma sobre todos os valores de x e y é 1. 

Suponhamos que X possa assumir qualquer um dos m valores х1, Ly c Xy 
e Y possa assumir qualquer um dos n valores уз, у», . . ., Yn. Então, a probabi- 
lidade do evento “X = x; Y = ук” é dada por 


P(X-—wyY-wu e ftw) (14) 


Uma função de probabilidade conjunta para X e Y pode ser representada 
por uma tabela de probabilidade conjunta, tal como na Tábua 2-3. A probabili- 
dade de ser X =x; se obtêm somando-se todas as entradas da linha correspon- 
dente a x; a saber : 


j 
P(X=x) = filas) = х Faia ук) (15) 


Рага ј = 1, 2,... ,m, esses valores são dados pelas entradas “totais” constantes 
da coluna extrema direita da Tábua 2-3. Analogamente, a probabilidade de ser 
Y = y, se obtém somando-se todas as entradas da coluna correspondente а 
yj a saber: 


PY=1) = fot) = S fina) (16) 


Para k= 1, 2, ..., n, tais valores constam da linha (ou margem) inferior da 
Tábua 2-3. 


Tábua 2-3 


Гр) Hay уз) ad Fe, Yn) 


Гб, Ya) Fa Ya) gn To, у) 


Гб) Гоа us) gam Га, Yn) fa (Cm) 
Y 
T 


Total Geral 
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Pelo fato de as probabilidades (15) e (16) serem obtidas dos valores das 
margens da tabela ў, (2;) e f=(Yyx) (ou simplesmente / (ж) е}; ())são comu- 
mente chamadas funções marginais de probabilidade de X e Y, respectivamente. 
Note-se, outrossim, que 


m 


Y nía) = 1 У fol) = 1 (17) 


=? 


о que pode ser escrito como mn 
Y Y Каи) = 1 (18) 
$51 RSL 
Isto nada mais é do que a afirmativa de que a probabilidade total de todas as en- 
tradas é 1. O total geral 1 consta do quadro no canto inferior direito da Tábua. 
A função de distribuição conjunta de X e Y é definida como 
F(xy) = P(X <r, Y<) = Y Y fuv) (19) 
тг] 
Na Tábua 2-3, F (x, у) é a soma de todas as entradas para as quais 


LI е WLY. 


2. Caso contínuo 
O caso em que ambas as variáveis são continuas se obtém facilmente por 
analogia com о caso discreto, substituindo somatórios por integrais . Assim, a 
função de probabilidade conjunta das variáveis aleatórias X e Y (ou, mais comu- 
mente, a função de densidade conjunta de X e Y) é dada por 


1. Хау) > 0 


zu A. f. f(z,y)dzdy = 1 


Graficamente, z = f(%, y) representa uma superfície, chamada superfície de 
probabilidade, tal como se vé na Fig. 2-6. O volume total delimitado por esta su- 
perfície e o plano xy é igual a 1, de acordo com a propriedade 2 acima. A proba- 
bilidade de X estar entre a e b, e de Y estar entre c e d, é dada graficamente pelo 
volume sombreado na Fig. 2-6, e matematicamente por 


b d 
Pla<X<b,c<Y<d) = , y) d: ё 
( : ) i f. f(z, y) dz dy (20) 


z = /(®,у) 


Fig. 2-6 
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Mais geralmente, se A € um evento qualquer, haverá uma região R, do plano 
xy que lhe corresponde. Em tal caso, obtém-se a probabilidade de A efetuando- 


se a integração sobre R,, isto é, 
P(A) = ff f(x, y) da dy (21) 
Ra 


A função de distribuição conjunta de X e Y neste caso é dada por 
E E 
F(ny = P(X<w,Y<y) = f i fu, 0) dudo (22) 


Segue-se, por analogia com (10), pág. 57, que 


ФЕ 
ape» (28) 


i.e., obtém-se a função de densidade diferenciando a função de distribuição em 
relaçãoa xe a y. 
De (22), obtemos 


Lo. LN f(u, v) du do (24) 


S. So Hut) dudo (25) 


Chamamos (24) e (25) funções de distribuição marginal, ou simplesmente fun- 
ções de distribuição de X e Y, respectivamente . As derivadas de (24) e (25) em 
relação a x e a y chamam-se, então, funções de densidade marginal, ou simples- 
mente funções de densidade de X e Y, e são dadas por 


һа) = [ renw ло - f ЖООЛУ: 


P(X <x) = Fila) 


P(Y&y) = Fay) 


1 


VARIÁVEIS ALEATÓRIAS INDEPENDENTES 


Sejam X e Y variáveis aleatorias discretas Se os eventos X=xeY=y 
são independentes para todo x e todo y, então dizemos que Xe Y são variáveis alea- 
tórias independentes. Em tal caso 


P(X=x, Y =y) = P(X=x)P(Y =y) (27) 
ou equivalentemente 


Fay) = file) (0) ; (28) 
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Reciprocamente, se, para todo x e todo y a função de probabilidade conjunta 
f (x, y) pode expressar-se como o produto de uma função só de x e uma função só 
de y (as quais são então as funções de probabilidade marginal de X e Y), Xe Y são 
independentes. Se, entretanto, f (x, y) não pode expressar-se desta forma, X e Y são 
variáveis aleatórias dependentes. 

Se X e Y são variáveis aleatórias contínuas, dizemos que são v.a indepe- 
dentes se os eventos X < xe Y < y são eventos independentes para todo x e todo 
y. Nesse caso, escrevemos 


P(X<zx, Y<y) = P(X <u) P(Y <y) (29) 
ou equivalentemente 
F(x,y) = Fur) Poty) (30) 


onde Fi(x) e F>(1)são as funções de distribuição (marginal) de X e Y, respectiva- 
mente. Reciprocamente, X e Y são variáveis aleatorias independentes se, para todo 
x e todo y, sua função de distribuição conjunta F (x, y) pode expressar-se como o 
produto de uma função só de x e uma função só de y (que são então as distribui- 
ções marginais de X c Y, respectivamente) Se, entretanto, Е (x, y), não pode ex- 
pressar-se desta forma, X e Y são dependentes. 

Para variáveis aleatórias contínuas independentes, vale também o fato de 
que a função de densidade conjunta f (x, y) é o produto de uma função só de 
X. f(x) e uma função só de y, Гу) е essas funções são as funções de densidade 
(marginal) de X e Y. 


MUDANCA DE VARIÁVEIS 


Dadas as distribuições de probabilidade de uma ou de mais variáveis aleató- 
rias, podemos querer achar distribuições de outras variáveis aleatórias que depen- 
dam delas de uma certa maneira. Os teoremas que seguem indicam processos para 
obtenção dessas distribuições, tanto para o caso discreto como para o caso con- 
tínuo. 


1. Variáveis Discretas 


Teorema 2-1: Seja X uma v.a. discreta cuja função de probabilidade é f(x). Seja 
U uma v.a. discreta definida em termos de X por U = p(X) onde 
a cada valor de X corresponde um e um só valor de U, e vice-ver- 
sa, de modo que X = y(U). Então a função de probabilidade de 
U é dada por 


glu) = Дуб) (31) 
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Teorema 2-2: Sejam X e Y variáveis aleatórias discretas com função de probabi- 


lidade conjunta f (x, y). Sejam U e V duas variáveis aleatórias 
discretas definidas em termos de X e Y por U = $i (X, Y), 
V = $; (X, Y), onde a cada par de valores de X e Y corresponde 
um e um só par de valores de U e V, e reciprocamente, de modo 
que X = y, (U, V), Y = y, (U, V). Então a função de probabi- 
lidade conjunta de U e V é dada por 


g(u,v) = HACA v), y, (4, v)] (32) 


2. Variáveis Contínuas 


Teorema 2-3: Seja X uma v.a. contínua com função de densidade f(x). Defina- 


mos U = ¿(X) onde X = y(U) tal como no Teorema 2-1. 
Então, a densidade de probabilidade de U + dada por g (u), onde 


g(u) dul = f(x) dx] (33) 


cw at) = O E] = fere А 


Teorema 24: Sejam X e Y duas variáveis aleatórias contínuas com função de 


densidade conjunta f(x, y). Definamos 
U = 4 (X, Y), V = Ф,(Х, Y) onde X= y,(U, V), 
Y = y,(U, V)tal como no Teorema 2-2. Então a função de densi- 
dade conjunta de U e V € dada por g и, v) onde 
glu,v) dudo] = f(x,y) da dy| (35) 


ou 


tu v) = fera || = fles Qu) voto YI] | (8) 


Em (36), o determinante jacobiano, ou abreviadamente o jacobiano, € dado 


por 


de de 
pode») _ ou др e 
9(и, v) ду ду 
ди v 


DISTRIBUIÇÕES DE PROBABILIDADE DE 
FUNÇÕES DE VARIÁVEIS ALEATÓRIAS 


Os teoremas 2-2 e 2-4 envolvem especificamente funções de probabilida- 


de conjunta de duas variáveis aleatórias Na prática, pode ocorrer a necessidade 
da determinação da distribuição de probabilidades de uma função de várias variá- 
veis aleatórias Qualquer um dos dois teoremas será útil em tais casos 
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Teorema 2-5: Sejam X e Y variáveis aleatórias contínuas, eU = 4 (X, Y), V=X 
(a segunda escolha é arbitrária) Então a função de densidade de U 
é a densidade marginal obtida da densidade conjunta de Ue V conf 
Teorema 2-4. Resultado análogo vale para funções de probabilida- 
de de variáveis discretas 


Teorema 2-6: Seja f (x, y) a função de densidade conjunta de X e Y. Então a fun- 
ção de densidade g (u) da variável aleatória U = ,(X, Y)se obtêm 
derivando em relação a u a função de distribuição dada por 


Gu) = Plo (X,Y) <и = ff Ha,y) de dy (88) 
R 


onde R é a região para a qual $1 (%, Y) Su 


CONVOLUÇÕES 


Como conseqüència particular dos teoremas acima, podemos mostrar 
(Problema 2.23) que a função de densidade da soma de duas variáveis aleatórias 
continuas X e Y, isto é, de U= X + Y, tendo função de densidade conjunta, é dada 
por 


gu) = i fe, u—u) de (39) 


No caso especial de X e Y serem independentes, Hey) = flo) f(y) e (39) se 
reduz a 


gu) = f. fala) felu — x) de (40) 


que 6 chamada a convolução de f; ef;,0u, abreviadamente, f: * f». 
Eis algumas propriedades importantes da convolucáo: 


2. fa* e" fa) = (З) * fe 
3. fh*(fstf9)- fhi* fat fat fs 


Estes resultados mostram que f1, f2, fa verificam as leis comutativa, associativa e 
distributiva da álgebra em relação à operação convolução. 
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DISTRIBUIÇÕES CONDICIONAIS 


Já sabemos que, se P(A) > 0 
ja) = PNB) 1 
Р(В|А) ==, (41) 
Se X c Y são variáveis aleatórias discretas e se temos os eventos 
(A: X = 1), (B: Y = y), então (41) se torna 
He, y) (42 
f(x) ! 
onde f(x,y) = P(X=x, Y =y) é a função de probabilidade conjunta e 
f (х) é a função de probabilidade marginal de X. Definimos 


fla = PED (43) 


e designamo-la função de probabilidade condicional de Y dado X. Analogamente, a 
função de probabilidade condicional de X dado Yé 
Fa, y) 


ffo | = 4 4 
Fely) 7200) (44) 


Р = X= = 


Por vezes denotamos fix | y) e fly |x) por fx | y) e Р, (y | x) respectivamente. 
Estas idéias estendem-se facilmente ao caso em que X e Y sáo variáveis alea- 
tóras contínuas. P. ex., a função condicional de Y dado X é 
fla, 1) 
f(y;€) = 5 45 
Hu e) Trin) (45) 
onde fix, y) é a função de densidade conjunta de X e Y, e f, (х/ é a função de 
densidade marginal de X. Utilizando (45), podemos, p .ex., obter a probabilidade de 
Y estar entre ce d, dado que x « X < tda ¿essa probabilidade é 


d 
P(e<Y<d! r<X<cr+do) = f fu ix) dy (46) 


Estes resultados podem generalizar-se. 


APLICAÇÕES À PROBABILIDADE GEOMÉTRICA 


Vários problemas probabilísticos decorrem de considerações geométricas, ou 
admitem interpretações geométricas. Suponha-se, p. ex., que tenhamos um alvo na 
forma de uma região plana de área K, e uma parte dela com área K,. Então, é 
razoável admitirmos que a probabilidade de atingir a região de área K, seja pro- 
porcional a Ку. Definimos, pois, к 

1 


P (atingir a região de área Kı) = É (47) 
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admitindo-se igual a 1 a probabi- 
lidade de atingir toda a área K. 
Naturalmente, podem formular- 
se outras hipóteses. P. ex., pode- 
ria ser menor a probabilidade de 
atingir áreas exteriores a К, etc. 
O tipo de hipótese admitida de- 
fine a função de distribuição de 
probabilidade. 


Fig. 2-7 


Problemas Resolvidos 


VARIÁVEIS ALEATÓRIAS DISCRETAS 
E DISTRIBUICOES DE PROBABILIDADE 


2.1.Consideremos a jogada de um par de dados e seja X a variável aleatória '“soma 
dos pontos”. (a) Determine a distribuição de probabilidade de X. (b) Construa 
um gráfico para esta distribuição de probabilidade. 


(a) A Fig. 1.17, pág. 25, dá os pontos amostrais para as jogadas de um par de dados. A 
va. X é a soma das coordenadas para cada ponto. Assim, para (3, 2), temos Х = 5. 
Como todos os 36 pontos amostrais são igualmente prováveis, de modo que cada 
ponto amostral tem probabilidade 1/36, obtemos a Tábua 2-4. P. ex., em correspon- 
dência com x = 5, temos os quatro pontos amostrais (1, 4), (2, 3), (3, 2), (4, 1), de 
modo que a probabilidade associada é 4/36. 

Tábua 24 


х 2 3 4 5 


fiz) 1/36 | 2/36 | 3/36 | 4/36 


(b) Podemos empregar um gráfico em barras ou um histograma (Fig. 2-8 ou Fig 2-9), 
conforme queiramos encarar X como variável discreta ou como variável contínua. 
Note-se que na Fig. 2-8 a soma de todas as ordenadas é 1, enquanto que na Fig. 2-9 a 
soma de todas as áreas retangulares é 1. 


Ha) 
6/36 


5/36 


4/36 


3/36 
2/36 
“yl i 
2 3 4 5 6 7 8 10 n 12 E 


Fig. 2-8 


2:2. 
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Fig. 2-9 


(a) Determine a distribuição de probabilidade de meninos e meninas em famí- 
lias com três filhos, admitindo iguais as probabilidades de menino e menina 
(b) Faça um gráfico de distribuição. 


(a) 


(b) 


O Problema 1.46 tratou o caso de n experimentos mutuamente independentes, em 
que cada experimento tem apenas dois resultados possíveis, А e A; com as probabili- 
dades р e а= 1 — p. Vimos que a probabilidade de obter exatamente x АА nass 
provas é „C, p* 9" 7. Tal resultado se aplica ao presente problema, desde que admita- 
mos que os nascimentos sucessivos (“provas”) sejam independentes no que diz respei- 
to ao sexo da criança. Assim, A designando o evento “menino”, п = 3, ep = 9 = i 
temos, 


QN AMOR 1M 
P (exatamente x meninos) = Р(Х =x) = sedã) (2) = O) 


onde a v.a. X representa o número de meninos na família. (Note-se que X está defini- 
da no espaço amostral de 3 provas). A função de probabilidade de X, 


3 á Ж 
Jj = 0.0) Tábua 2-5 


é apresentada na Tábua 2-5. 


O gráfico pode ser construido ou como na Fig. 2-10 ou como na Fig 2-11, depen- 

dendo de como queiramos considerar a variável X — discreta ou contínua, Observe-se 

que o zero do eixo dos xx foi deslocado. 
LI 


Hn 


М ШЕ > 


Number st beys E =e 
Fig 210 


— 
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FUNÇÕES DE DISTRIBUIÇÃO DISCRETA 


2.3. (a) Determine a função de distribuição F (x) para a variável aleatória X do 


Probl. 2.1; 


(b) Faça o gráfico desta distribuição 
(a) Temos (х) = Р(Х<х) = i fiu). Então, dos resultados do Problema 21 


vem 
0 
1/36 
3/86 
Е(х) = + 6/86 


35/36 
1 


(p) v. Fig. 2-12, 


== <y <2 


2<1<3 
3<»<4 
14<e<5 


m 


m 
ә Б 
ы 
to 


^ IN 
зон 
AA 
8 


Fig. 2-12 


= 9 
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2.4. (и) Determine a função de distribuição Fix) da variável aleatória X do Proble- 
ma 2.2 e(b) faça o gráfico dessa distribuição. 
(a) Utilizando a Tábua 2-5 do Problema 2.2, obtemos: 


0 =» < e < 0 
1/8 ф©=<1 
F(z) = 1/2 1<%<2 
5/8 Sales 
i Saas 


(b) А Fig. 2-13, exibe o gráfico da função de distribuição de (a). 


Fig. 2-13 


VARIAVEIS ALEATÓRIAS CONTINUAS 
E DISTRIBUIÇÕES DE PROBABILIDADES 


2.5. Uma variável aleatória X tem função de densidade fix) = сх? + 1), com 


PE A 2 
(a) Determine o valor da constante с (b) Determine a probabilidade de X 


estar entre 1/3 e 1. 


(a) Devemos ter 


f. Қа) de = 1, ie 


de modo que с = 1/7. 
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(b) 1922 1 então ou eR «x«i o -1«X «- m Assim, a probabi- 
lidade é 
pp dic ST " afi dë 
rJ i ma “adia PRL 


-Kpa 


2.6. Determine a função de distribuição correspondente à função de densidade do 
Problema 2, 5, 


= tanto 


1 


F(x) = ( Хи) йи = 


[tan7! s — tanT1(-0w)] = 


aj 


A + ы {ап-1хж 
т 


2.7. A função de distribuição de uma variável aleatoria X é 1 
Jie 220 
Lo x<0 


Determine а) a função de densidade, (b) a probabilidade de X> 2 e (c) a pro- 
babilidade de —3 < X < 4. 


F(z) = 


. d 2e? x20 
(a) flo) = a, Fo = 0 2<0 
(5) PX>2) = у 2e-9udu =" —e-2u = et 
2 2 


Outro método. 
Por definição Р(Х <2) = F(2) = 1— e74. Logo, 


P(X>2) = 1- (1-6-0) = ect 


a SR | 
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4 0 4 
() Pr3<x<a = fmm - fom а Í 26-94 du 


4 
= —m| = 1— 6-8 
o 
Outro método. 
P(-3«X«4) = P(X<4) – P(X<-3) 
= F(4) — F(-3) 
= (d-e9-(0) = 1-0 


DISTRIBUIÇÕES CONJUNTAS E VARIÁVEIS INDEPENDENTES 


- 2.8. A função de probabilidade conjunta de duas variáveis aleatórias discretas X e Y 
é f(x,y) = c(2% + y), onde x e y podem tomar os valores inteiros tais que 
0< x < 2,0<y< 3, sendo f(z, y) = 0 em todos os outros casos 
(a) Determine o valor da constante c. (b) Determine P(X — 2, Y — 1). 

(c) Determine Р(Х > 1, Y € 2). 


(a) A Fig. 2-14 exibe os pontos amostrais (x, y) para os quais as probabilidades sao di- 
ferentes de zero. As probabilidades associadas a esses pontos, dadas por e(Zz + y), 
constam da Tábua 2-6. Como o total geral, 42c deve ser igual a 1, temos c = 1/42. 


Tábua 2-6 


2 


A РУ а а a 
2 е . 
1 е е 
e e * 
0 1 2 


Fig. 2-14 
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(b) Da Tábua 2-6 vé-se que Р(Х 2, Y 1) = 5e 3x 
(c) Da Tábua 2-6 
PX21Y«2 = 2 > fev) 
x>1 У<2 
= (2e+3c+4c) + (4c + 50 + бе) 
a A _ 4 
= 24e = a2 cg 


tal como indicado pelas ertradas sombreadas na Tábua. 


2.9. Determine as funções de preu “bilidade marginal (a) de X e (b) de Y de variá- 
vel aleatória do Problema 2 € 

(a) A função de probabilidade ma.ginal para Х é dada por Р(Х ==) = fi) e 

pode ser obtida a partir dus totais marginais da coluna direita da Tábua 2-6, Por ali 


se vé que 
бе =1/7 x=0 


PX=x) = filo) = 14е = 1/3 s=1 
220 = 11/21 == 2 
Verificação: E I 


(b) A função de probabilidade marginal рага Y é dada por P(Y = y) = f(y) e pode 
ser obtida a partir dos totais marginais da última linha da Tábua 2-6. Por ali se vé 


que 
Ge = 1/1 y=0 
9с = 3/14 =1 
Р(Ү= у) = fly) = E 
12=27 y=2 
15е = 5/14 y=3 
Verificação: EE —1 


2.10. Mostre que as variáveis aleatórias X e Y do Problema 2.8 sáo dependentes 


Se X e Y são independentes, devemos ter, para todo x e todo y, 


PX=xY=y) = P(X-a)P(Y = у) 
Mas, como se vê dos Problemas 2.80) e 2.9. 
" 5 11 3 
=P == = == == = — 
P(X=2, Y =1) = 35 PX=2) = 3 Р(Ү=1) = ї 


de modo que Р(Х =?, У =1) + Р(Х = 2) Р(У = 1) 
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Este resultado decorre também do fato de que a função de probabilidade con- 
junta (2a + y)/42, não pode expressar-se como o produto de uma :função de x somen- 
te e uma função de y somente, 


2.11. A função de densidade conjunta de duas variáveis aleatórias X e Y, conti- 
nuas é 


[cry 0<w<4, 1<y<5 
fa) = 1o 


em caso contrário 


(a) Determine o valor da constante c. 
(b) Determine P(1 « X «2, 2« Y «3). 
(c) Determine P(X 23, Y « 2). 


(a) Devemos ter a probabilidade total igual a 1, isto é, 


ff лова = 1 
` жү 
Utilizando a definição de f (x, y), a integral tem o valor 
4 5 4 ^5 
у f exydzdy = ef Е sy dy Jaz 
7-0 Jy=1 “ezo Ly 
5 + 
25r ш 
E x dr = е [| 2-3) de 
y=1 И Jea 2 2) 


ll 
a 
o 

A 
to 
E 
a 
& 

I 
EA 
© 
E 
К 


Então,96c= 1ес= 1/96. 


(b) Utilizando o valor де с obtido em (2), temos 


a 96 


3 +3 
[| Í xy ay Jar = 
il4y-2 


2 po. 
PI<X<22<Y<3) = f f TU dy dy 
pet e 
1 2 


96 
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(e) 4 m 
Pizas Yrsg = f. Í Sp da dy 
^d 
- ak, [ E du Jas 
_ AL - EN S 
: xf. TU = ig 
2.12. Determine as funções de distribuição marginal (a) de X, (b) de Y do Probl 
211, 


(a) А função de distribuição marginal de X, se 0 & x < 4 é 


íi И 
Fis) = PAS = f. f fu, v) dic do 
NEN EM 
E du dv 
= d Sis 96 dv 
Ef O © ‚| = dé 
96 dio pum кше Jd Es ng 


Para 2>4, Fila)=1; para x < 0, F,(x) = 0. Assim, 


po <0 
Fu = 22118 0<:<A4 
da? mie 


Como Е, (=) é contínua em x= 0 e x= 4, podemos substituir «por «паз ex- 
pressões acima. 
(b) A função de distribuição marginal para Y, se — é 


Fau) = PIY<y = f£ E ѓо, v) du d» 
v=1 


uv 
—dudv = = 
“|, Ls 24 


Рага y 2 5, Fo(y) = 1. Para y < 1, Fo(y) = 0. Assim, 


fe yc1 
Fau) = (q2—1)/24 1<y<5 
n y>5 
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Como Е. (y) é contínua em y =1 ey =5, podemos substituir < por & nas expres- 
sões acima. 


2.13. Determine a função de distribuição conjunta das variáveis aleatórias X e Y do 


Problema 2.11. 


Pelo Probl. 2.11, vê-se que a função de densidade conjunta de X e Y pode es- 
crever-se como o produto de uma função de x somente por uma função de y somente. 
De fato, f(x, y) = fı (x) fz (y), onde 


[ey 0<x<4 [eu 1<у<65 


filo = To emcasocontrário — 777) T (0 emcaso contrário 


e cio = c = 1/96. Segue-se que X e Y são independentes, de modo que sua função 
de distribuição conjunta é dada рог F(x, y) = F (x) F»(y). As distribuições marginais 


Fi(x) e Fa(y) foram determinadas no Probl. 2.12, e a Fig. 2-15 exibe a definição 
resultante para F (x, y). 


Fieu) = 0 F(z.y)-1 


Fízy)-0 Pay? — 1) 


F(zy)-70 Fry = 0 F(r,y)—0 


Fig. 2-15 


2.14. No Problema 2.11, determine P(X + Y < 3). 


Na Fig. 2-16 indicamos a região retangular 0<v<4 1€ y «5 noin 
terior da qual a função de densidade conjunta de X e Y é diferente de zero. A probabili- 
dade procurada é dada por 


PIX+Y<3) = ШЕЛҮҮ 
R 
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onde R é a parte do retângulo sobre a qual x + y < 3 (sombreada na Fig. 2-16). Como 
fx. y) = xy/96 sobre R, a probabilidade é dada por 


2 3-2 
ху 
== de di 
Í dis 9e ^^ 6 


Fig. 2-16 


MUDANÇA DE VARIÁVEIS 
2.15. Prove o Teorema 2-1, página 62. 
A função de probabilidade de U é dada por 
gu) = P(U =u) = P[e(X)-w] = PIX=y(u)] = fly] 
Pode-se provar de maneira análoga o Teorema 2-2, pág. 63. v. Probl. 2-66. 
2.16. Prove o Teorema 2-3, página 63. 


Consideremos primeiro o caso em que u = Ф (х) ou x = Y (u) uma função 
crescente, i.e., и cresce com x (Fig. 2-17). Então, pela figura, temos: 


(1) Р( <<) = Pla <Х < 23) 


2.17 
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ou 


(2) f aeo de = Sr de 


1 u 


Fazendo x = y(u) na integral à direita,. 
(2) pode ser escrita 


f ийй = | ОКЕ? 


1 “iu 


Isto será válido para todo uj e u2 
somente se os integrandos forem idénticos, i.e., 


gu) = ДЫС 


Trata-se de um caso especial de (34), pág. 63, onde y'(u) > 0 (i.e., o coeficiente 
angular é positivo). Para o caso em que y'(u) < 0, i.e., u é uma função decrescente 
de x, pode-se mostrar também que (34) é válida (v. Probl . 2.67). Pode-se demonstrar o 
Teorema também no caso em que y(1)20 ou yu) < 0. 


“Prove o Teorema 2-4 pág 63. 


Supomos primeiro que, quando х c y crescem, ue v também cresçam. Pode-se 
então mostrar — tal como no Probl. 2.16 — que: 
Р(ш < 07 <и, vj «V&v) = Ple < X < ta у S.Y < Yo) 


ou mua quus t, qu 
| у glu,v) dudo = f f f(x, y) dz dy 
Za a a Y 


Fazendo = = y(u, v), у = Yalu, v) na integral à direita, temos, em virtude de um 
teorema de cálculo avangado 


ер —" 
Í f guo) dudo = Í Í ffo Gu v), yolu, 0)]J du dv 
ш a u Yo 


onde J 


é o jacobiano. Assim 
glu, v) = /ул(и,®), valu, 0) 4 


que é precisamente (36), pág. 63, no caso em que J > 0. Analogamente, podemos de- 
monstrar (36) no caso em que < 0. 
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2.18. A função de probabilidade de uma variável aleatória X ё 


2" golge 
0 em caso contrário, 


fa) = 
Determine a função de probabilidade da variável aleatória U = X*+ 1. 


Сото U = X!--1 а relação entre os valores de u e x das variáveis aleatórias U 
e X é dada por u —x*--1 ou у= 491, onde u= 2, 17, 82, ... tomando-se 
а raiz real positiva. Então, a função de probabilidade procurada рага U é dada por 


4 
2-Vwi u=2,17,82,... 
ge = 0 em caso contrário 


aplicando-se o Teorema 2-1, pág. 62, ou o Problema 2.15. 


2.19. A função de probabilidade de uma variável aleatória X é dada por 


[ 7781 -3<r<6 

fa) = 1 - 
0 em caso contrário 

Determine a densidade de probabilidade para a variável aleatória U = (12 — X). 


Temos u = 102 — 2) ou х = 12 — Зи. Assim, а cada valor de x corres- 
ponde um е um só valor de и, e reciprocamente. Os valores de м correspondentes а 
х=-—3 ех =6 são и =5 е и = 2 respectivamente. Como Y (и) = dx/du —— 3, decorre 
do Teorema 2-3, pág. 63, ou do Problema 2.16, que a função de densidade de U é 


[1230/27 2«u«5 


glu) Lo 
em caso contrário 
s y о, 5 
Verificação: 112-342, _ Ul _ 
1 moo 243 po! 


2.20. Determine a densidade de probabilidade da variável aleatória U = X? onde 
X é v.a. do Problema 2.19. 


Temos u = «2 ou х = +Yyu. Assim, а cada valor de x corresponde um 
único valor de и, mas a cada valor de и % 0 correspondem dois valores de x. Os valores 
de x tais que —3 < x < 6 correspondem os valores de и tais que 0< и < 36 tal co- 
mo se vé da Fig. 2-18. 


| ————— | 


—— 
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Fig. 2-18 


Pela figura, vê-se que o intervalo —3 < x <3 corresponde 0 «и <9 em 
quanto que 3 < х < 6 corresponde a 9 < и < 36. Neste caso não podemos usar o 
^ Teorema 2-4 diretamente; procedemos, então, como segue. A função de distribuição de 
Ué 
Glu) = P(U&w) 


Ora, se 0 < u < 9 temos 
Gu) = PU<u) = P <u) = P(-vu&X«vyu) 


Yu 
= f лда 
—vu 
Mas se 9 < м < 36 temos 
Yu 
сш) = PUKY = Рез<х<ун) = feme 


3 


Como a função de densidade g(u) é a derivada de G(u), temos, pela regra de Leibniz (1 2), 


ADALAT) ушышо 
2vu 
gu) = Куи) " 
| 2yu 9<u< 36 
to em caso contrário. 


Utilizando a definição dada de f(x), vem: 
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glu) 


| Vu/81 0 <u<9 
= Vu/162 9 <и < 36 
| 0 em caso contrário. 


E El 
3/9 |26 


9 36 913/2 
Verificação: f vu f Vu = Y 
J 8 du + A 1654“ 


248 |; ' 243 |, 


2.21. Se as variáveis aleatórias X c Y tém funcáo de densidade conjunta 


0 em caso contrário, 


xy/96 0<2<4, 1<y<5 
foy = 


(v. Probl. 2.11) determine a função de densidade de U = X + 2Y. 


Método 1. 


Seja и = x+2y, v = x, sendo a segunda relação escolhida arbitrariamente. 


Então, a resolução simultanea dá x — v, y — Hu — о). Assim. a região 
0 €x <4, 1 <y <5 corresponde à regido 0 < v < 4, 2 < u—v < 10 
sombreada na Fig. 2-19. 

O jacobiano é dado por 


Fig. 2-19 
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Então, pelo Teorema 2-4, a função de densidade conjunta de U e Vé 


folu—v)/384  2«wu—-v«10, 0<v<4 


gu) = 1 0 em caso contrário. 
A funcio de densidade marginal de U é dada por 
u-? 
v(u— v) 
5% do <u< 
E 381 dy 2<u<6 
t a(u— 
f Mid 6 cu « 10 
s = .=0 38 
„4 
v(u—v) 
— du 10 <u « 14 
Í, =а-10 384 
0 em caso contrário, 


como se vé pelas regiões sombreadas 1, П, Ш da Fig. 2-19. Efetuando a integração, 
obtemos: 


(и — 2)2(u + 4)/2304 2<u<6 

| (3u — 8)/144 6<u<10 

se) = (348u — u3 — 2128)/2304 10 < u< 14 
| 0 em caso contrário. 


Uma verificação consistirá em mostrar que a integral de gt) é igual a L. 
Método 2. 
A função de distribuição da variável aleatória X + 2Y é dada por 


P(X-2Y Xu) = ff fla, y) de dy = ff EU de dy 
ay а TIE. 


ү}? 
ocr 
y 


ж 


АА 
mm 


Para 2 <и < б vê-se (Fig 2-20) que a última integral é igual a 


Mr p UIN у “cuca? ox 
zy " mue? а 7). 
Í 2 Í, п ga Li [ 768 5] * 


[= 


2 
A derivada desta expressão em relação a u é (и — 2) (и + 4)/2.304. De modo análogo, 
podemos obter o resultado do Método 1 para 6 <и < 10, etc. 
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la 
+ 
А 
TR. 
E 
o хз, 
Es 
XE 
1 — Р 
Es 
2 
Fig. 2-20 


Fig. 2-21 
2.22.Se as variáveis aleatórias X e Y têm função de densidade conjunta dada por 


xy/96 0<х2<4, 1<y<5 
Hay) = 


0 em caso contrário, | 


(v. Probl. 2.11), determine a função de densidade conjunta de Us X Y", 
V= PY. 
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Seja и = xy?, v = æ?y. Dividindo estas equações obtemos y/x = и/р de 
modo que y = ux/v. Isto conduz à solução simultânea x = v2/3u 1/3, y = 12/32 —1/8, 
Aimagemde 0 <= «4, 1 < у < Б no plano uv ё dada por 


0 € atra < 4 1 € usyris < 5 
que equivale a 
v? < 64и v < u? < 125v 
Esta região é apresentada sombreada na Fig. 2-21. 
O jacobiano é dado por 

cab qu 20-13-18 
J= А = 1-28-23 

2 -usy=irs  —Lyarsy-418 А 

3 3 


Assim, a função de densidade conjunta de U e V é, pelo Teorema 2-4, 


(02/8u— 1/3) (u2/8 у 1/3) 


. sud = 96 ($u-9/89—27) v? < 64и, v < и? < 125v 
Б = 
0 em caso contrário. 
: - iii v? < 64u, v < u? < 195v 
ou giu, Y = 
0 em caso contrário. 
CONVOLUÇÕES 


2.23. Sejam X e Y variáveis aleatorias com função de densidade conjunta f(x, y). 
` Prove que a função de densidade de U= X+Yé 


g(u) = S f(v, u— v) dv 


Método 1. 


Seja U = X +Y, V = X, (onde a segunda equação foi acrescentada arbitra- 
riamente). Temos, correspondentemente, u = x + Y, v= xoux= v, y= и— у. О jaco 
biano de transformação é dado por 


дш dz 

ӯ ðu dv 0 1 i 

Cm duo па 7 
du ðv 


Assim, pelo Teorema 2-4, pág. 63, a função de densidade conjunta de U e V é 


g(u,v) = fv, ux) 
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Decorre de (26), pág. 61, que a função de densidade marginal de U é 
o 
giu) = f flv, u — v) dv 


Método 2. 


A função de distribuição de U = X + Y é igual à integral dupla de f (x, 2) 
sobre a região definida por xy <", Le. 
вш = ff nena 
mer f 


Como a região está abaixo da reta x | y = u, (sombreada na Fig. 2-22), vé-se que 


Gu) = f И J Í ea fü) а Jas 


A função de densidade de U é a derivada de G(u) em relação a u e é dada por 
gw) = f Ha, u — x) de 
aplicando a regra de Leibniz primeiro à integral em х e em seguida à integral em y. 


Y 


Fig. 2-22 
2.24. Faça o Problema 2.23 se X e Y são variáveis aleatórias independentes com 
funções de densidade fi(), fa(y) respectivamente. 


Neste caso, a função de densidade conjunta é Ha, u) = fix) fo(y), de modo 
que, pelo Problema 2.23, a função de densidade de U= X +Y é 


so = | лоли = ht 


que é a convolução de fı efa 
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2.25.Se X e Y são variáveis aleatórias independentes com funções de densidade 


2€? д» 0 Ber y>0 
0 2<0 


io À = 
hi) =] hU) = iy — vo 


determine a função de densidade de sua soma U= X + Y. 


Pelo Problema 2.24, a função de densidade desejada é a convolução de f e f. 
e é dada por кя 


gu) = fi*h = Г Filo) folu — v) do 


No integrando, p se anula quando y < 0 e "A se anula quando у > u. Logo 


glu) = f 71017) de 
0 


Ш 


u 
cez f edy = Ge-Sugu—1) = 6(e-%u—e-3u) 
0 


se u>0 eg(u) = 0 se u<o0, 
am 


= 1 
Verificacio: S. оо) = sf (е-и ази = (1-1) ч 


2.26. Prove que fı“ f» = }»*], (Propriedade 1, pág. 64). 


Temos 
hth = f Filo) falu — v) do 
uc 
Fazendo w = м — v de forma que v = u— w, dv — —dw, obtemos 
-ә E 
ftf = f filu — w) fa(w)(—dw) = f foQv) fa (u—w)dw = fs* f, 
w=% w=-e 


DISTRIBUIÇÕES CONDICIONAIS 


2.27. Determine (a) f (y 12), (D) P(Y= 1 | X= 2) para a distribuição do Problema 
2.8. 


(a) Utilizando os resultados dos Problemas 2.8 e 2.9 temos 
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muta = Hu) 
fold = sa) 
de modo que, com x = 2 
рр = tua _ diu 
MD = "ipei 22 
же 5 
P(y=1/X=2) = f(1]2) = 22 


2.28. Se X e Y têm função de densidade conjunta, 
[+y 0<2<1, 0<у<1 
fea) = 1 


| "T 
(0 em caso contrário 


determine (a) f(y|2), (b) PY >4 | i<X<i-+da). 


(a) Para0 <x <1, 


ho) = 
| 3 + dey 
: 0<y<1 
e fuja = 0 = ith 
i 0 em caso contrário 


Para outros valores de «œ, f(y | х) não é definida. 


z ү а ii a 1 q 5 
o PY-pdexepea) = f лира = | a 


xy 0<xw<1l, U<y<a 


8 
0 em caso contrário 


Determine (a) a densidade marginal de X, (b) a densidade marginal de Y, 
(c) a densidade condicional de X, (d) a densidade condicional de Y. 


A região em que f(x, y) é diferente de zero aparece sombreada na Fig. 2-23. 


A c———vcGóoGó— ———: 
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(a) Para obter a densidade marginal de X, fixamos x e integramos em relação a y de 0 a 
x tal como indicado na faixa vertical da Fig. 2-23. O resultado é 


T 
ло = f^ Seydy = 48 
3-0 
para 0 < х < 1. Para todos os outros valores de x, fi (x) = 0. 
(b) Analogamente, a densidade marginal de y se obtém fixando y e integrando em rela- 
cioaxdex-y а x= 1, tal como indicado na faixa horizontal da Fig. 2-23. O 
resultado é, para 0 < y < 1, 


y 


H 
foy) = f 8xyde = Ay(l— y?) 
х=» 


= 
Fig. 2-23 
Para todos os outros valores de y, fa(y) = 0. 
(c) А função de densidade condicional de X é, para 0 < y < 1, i 
ul > Hed = AS ams 
ua fa) Lo outros x 


A função de densidade condicional não é definida quando ў, (у) = 0. 
(d) A função de densidade condicional de Y é, para O << # 


men p ДЭ Payar 
bala = Ato) — 1 0 outros y 
A função de densidade condicional não é definida quando 7, (+) = 0. 
Verificação: 


E 


cá * " 
[лаа = S dió de = 1, f Poty dy = f ау) dy = 1 
A do 


Jo 
1 1 
2x 
fila | y) da =f zli% = 1 
Í : y 1-9 


E x 
Í fat | e) di af 2 ay = 1 
0 q e 
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2.30. Determine se as variáveis aleatórias do Problema 2.29 são ou não independen- 
tes 


Na região sombreada da Fig. 2-23, 
Қау) = Buy file) = 4x3, foly) = Aull- y’). 


Logo, f(x, y) fi (е) fa(y), е assim, X e Y são dependentes. 

Deve-se notar que, do fato de ser f(x,y) = 8xy » não decore que f (x, y) 
possa expressar-se como o produto de uma função de x por uma função de y , e isto em 
virtude da restrição 0 «© у <x . Se tal restrição fosso substituída por uma outra restri- 
ção sobre y não dependendo de x (tal como no Problema 2.21), a conclusão então seria 
válida. 


APLICAÇÕES À PROBABILIDADE GEOMÉTRICA 


2.31 Uma pessoa jogando dardos acha que a probabilidade de o dardo atingir a re- 
gião entre re r+dré 


2 
Pir <R<r+dr = eli 5 (5) Jar 
Aqui R é a distância do ponto atingido ao centro do alvo, c é uma constante, 
e a é o raio do alvo (v. Fig. 2-24). Determine a probabilidade de atingir o 
“olho”, suposto este de raio b. Admita-se também que o alvo é sempre ~ 
atingido. 
A função de densidade é dada por 


2 
Es _ EA 
fm = JE (7) | 
Como o alvo é sempre atingido, temos 
a 2 
ZAEEIONE = 1 
do L e 


donde c = 3/22. Então a probabilidade de 
atingir o “olho” é 


o а p" rY b(3a? — b?) 
me = Ef [e (2) | = Ps 
f Е 2a Jo а М 2a? Fig. 2-24 


2.32. Escolhem-se ao acaso dois pontos no intervalo 0 < z < 1. Determine a pro- 
babilidade de a soma de seus quadrados ser menor do que 1. 


mA 


poe 
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Sejam X e Y as variáveis aleatórias associadas aos pontos dados. Como se admi- 
te que intervalos iguais tenham iguais probabilidades, as funções de densidade de Жат 
sáo dadas respectivamente рог: 


| [1 0<=<1 [1 0<y<1 
Q0) ле = + һо) = 


[0 ет caso contrário Lo em caso contrário 


Então, como X e Y são independentes, a função de densidade conjunta é dada por 
y 


0<<1, 0<у<1 
em caso contrário 


1 
(2) fe) -fie0/550) = in 


Segue-se que a probabilidade procurada é dada por 


(3) PG Y?«n = ff аа 
R 


Fig. 2-25 


| onde R é a região definida рог z? +y? <1, x 20, y >0, que é um quarto de 
| F círculo de raio 1 (Fig. 2-25), Mas como (3) representa a área de R vemos que a probabi- 
lidade procurada é 7/4, 


PROBLEMAS DIVERSOS h 


2.33. Suponhamos que as variáveis aleatórias X e Y tenham função de densidade 
conjunta dada por: 


дай [22+ y) 2<r<6,0<y<5 
х,у = 4 


| 0 em caso contrário 


Determine (a) a constante c, (b) as funções de distribuição marginal para X e 
У, (c) as funções de densidade marginal para Хе Ү,(4)Р(3< X< 4, ҮР 2), 
(e) P (X > 3), (0) P(X * Y > 4) (g) а função de distribuição conjunta, (A) se 
Xe Y são ou não independentes 


(a) A probabilidade total é dada por 


"2 
Í Í c(2x + y) de dy 
z-2 y=0 


1 
= 
5 

^ 
Es 

w 

u 

E 

Es 

SS 
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Para que isto seja igual a 1 devemos ter c = 1/210. 


(b) A função de distribuição marginal de X é 


күш = Po = I. I. fu, v) du dv 


z os 
f f Odudv = 0 2<9 
=-a Ju =% 
2u va _ 20% + bz — 18 
= Í, f. 216 lu do = 84 зс <6 


f f, tdud = 1 426 
u=2 210 


A função de distribuição marginal de Y é 


Fe) = pee = fo So оаа 


"M 
f Í Odudo = 0 у<0 
— — 


46 үз 
_ 9и +% _ y2+16y 
P S d сїй (iuh = gm SA 
^6 ys 
2u tv 
f. Ls EUN du dv 1 uz5 


(c) A função de densidade marginal para X é, pela parte (5), 


d (45 + 5)/84 2<u<6 
de (n 0 em caso contrário 


film) 
A função de densidade marginal para Y é, parte (b), 
(2y +16)/105 0<у<5 


а = 
fal) = a P Е fo em caso contrário 


4 5 
O PB<X<4 Y>?) = zs f. f „Фетида = E 
1=3 M 


_——— 


VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE 91 


ï 6 5 23 
(e) P(X>3) = SS, amm = 


N Р(Х+Ү> 4 = уу е, y) de dy 
& 


onde R é а região sombreada na Fig. 2-26. Conquanto se possa calcular este valor, 
é mais fácil utilizar o fato de que 


PX+Y>4 = 1-PAX+Y<4) = 1— ff /e 2m 
R 
onde R' é a região duplamente hachurada na Fig. 2-26. Temos 
1 4 4—2 2 
P(X-Y«4) = x. f. (22+) асбу = gt 


Assim, Р(Х + Y > 4) = 33/85. 


Fig. 2-26 Fig. 2-27 
(g) A função de distribuição conjunta é 
E u 
F(xy) = Р(Х< х, У< у) = Í f Fu, v) du du 
ы = Jom» 
No plano uv (Fig. 2-27), a região de integração é a intersecção do quadrante и < x, 


v<y e do retângulo 2 <и < 6, 0 « v < 5 (sobre a qual f(u, v) não se 
anula). Para (x, y) localizado como na figura, temos 


в 7 
ы. 2u +v _ 16у t3? 
Fis,y) = f. f. 210 dudo = “105 
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Quando (x, y) é interior ao retángulo, obtém-se outra expressáo, etc. A Fig. 2-28 
exibe os resultados completos. 


y 1 1 
1 
| l 
1 Fla, y) = | 
Fie) = 0 I 2x2 + 5z — 18 Py) =1 
l 84 ! 
l l 
l Pe ed 
F Fw = " + 18; 
Y у 
Fieu) = 0 2020 + ay? —Ву — Ро = gn 
Р 420 
П n П а 
1 I 
1 
Еу) = 0 | Кт) = 0 1 Fizy) = 0 
| 1 
1 1 
Fig. 2-28 
(h) As variáveis aleatórias são dependentes, pois E 


Hoy) + fil) fat) 
ou, equivalentemente, F(x, y) + F,(z) Falu). 


2.34. Seja a v.a. X com a fungáo de densidade 


6х(1-2) 0<2<1 
® = 10 Е 
ет саѕо сопітагіо 
" 3 


Determine uma função Y = A/X) que tenha a função de densidade 


[izy(i-y) 0<y<1 
9(y) = + АИ 
| 0 em caso contrária. 


Admitimos que a função incógnita, h, seja tal que os intervalos X <ue 
Y <y = h(z) se correspondam biunivoca e continuamente. Então Р(Х< v) — 
= P(Y <y), ie. as funções de distribuição de X e Y devem ser iguais. Assim, para 


0<жу<1, 
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- V 
r биа) du = f 120%(1 — 02) dv 
0 0 
За? — 24? = 3y*— 298 


Por inspecção, х = y? ou y = (х) = -FV/zé uma solução, e esta solugáo tem as 
propriedades desejadas, Assim, y aX 

2.35. Determine a função de densidade de U= XY se a função de densidade con- 
junta de X e Y é f (x, y). 


Método 1. 


Seja U = XY e V= X, donde u = xy, v = x ou х= v, y = u/v. Em 
tão, o jacobiano.é dado por 


me om 
du ðv 0 Ж 
= zs = =y 
z ду ду ъ-1 —uv-? 
du до 


Assim, a função de densidade conjunta de U e V é 


go) = ud» =) 


e daí, a função de densidade marginal de U, 


gu) = f g(u,v) do = f£ (65) а 


Método 2. 


A função de distribuição de U é 


G(u) = ff fa, y) de dy 


жи 
Para и > 0 a região de integração é apresentada na Fig. 2-29. Vê-se que 


cm = f [Soren jes Lf tema] 


Derivando em relação a и e aplicando a regra de Leibniz, obtemos 


mo Sole fiet) = Kee 


Obtém-se o mesmo resultado para и < 0, quando a região de integração é a região som- 
breada limitada pela hipérbole tracejada da Fig. 2-29, 


94 PROBABILIDADE E ESTATÍSTICA 


Fig. 2-29 


Fig. 2-30 


2.36. Um piso tem linhas paralelas cquidistantes (distancia /). Joga-se uma agulha de 
comprimento a < Г no piso. Determine a probabilidade de a agulha intercep- 
tar uma linha do piso. (Este problema é conhecido como Problema da Agulha 
Buffon) 


Seja X a variável aleatória que dá a distância do ponto médio da agulha à reta 
mais próxima. Consideremos uma variável aleatória © que represente o ângulo agudo en- 
tre a agulha (ou seu prolongamento) e a reta. Denotaremos por х е 0 quaisquer valores 
particulares de X e Ө Já vimos que X pode tomar qualquer valor entre 0 e 1/2, de modo 
que 0 <a < 1/2. Mas Ө pode também tomar qualquer valor entre 0 e 71/2. Segue-se 
que 


Р(х < X & x + dx) = 24 Pie < 0 <6 + de) = 24 
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ie. as funções de densidade de X e O são dadas por /; (2) = 2/1, falo) = 2/m. A ti- 
tulo de verificação, notamos que 


ati? 
Í 2 es f 246 = 1 
o bo r 


Como X e O são independentes, a função de densidade conjunta é 
2 
fis = т 


Da Fig. 2-30 vê-se que a agulha atravessa efetivamente uma linha se X < (a/2) 
sen Ө. A probabilidade de tal ocorrência é dada por 


4 (7 pasene 
= у dz de 
lz Jo=0 Jz-o 


Igualando-se a expressão acima ás freqüéncias observadas, obtemos valores 
de 7. Tal fato indica que o modelo de probabilidade descrito é apropriado. 


. Duas pessoas concordam em encon- 
trar-se entre 14 e 15 horas fican- 
do entendido que nenhuma delas 
esperará mais de 15 minutos pela 
outra Qual a probabilidade de se 
encontrarem? 


Sejam X e Y variáveis alcató- 
rias que representam os tempos de chega- 
da das duas pessoas, medidos em frações 
de hora após 14 h. Admitindo-se que 
iguais intervalos de tempo tenham iguais 
probabilidades de chegada, as funções de 
densidade de X e Y são dadas respecti- 
vamente por: 


0<х<1 


em caso contrário 


fila) 


0<y<1 Fig. 2-31 


em caso contrário 


falu) 


Então, como X e Y são independentes, a função de densidade conjunta é 


a) fw = fhi) foty) 


P 0<2<1, 0<y<l 


O — em caso contrário 
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Р t 
Como 15 minutos = 7 h, a probabilidade procurada é 


(2) e(t) = ff om 
R 


onde R é a região sombreada na Fig. 2-31. O membro direito de (2) é a árca desta 
região, e é igual a 1 — (2)(3) = Jg. pois o quadrado tem área 1, enquanto que os dois 


triángulos extremos têm, cada um, área 3(3)(2) . Assim, pois, a probabilidade desejada 
é 7/16. 


Problemas Suplementares 


VARIÁVEIS ALEATÓRIAS DISCRETAS 
E DISTRIBUIÇÕES DE PROBABILIDADE 


2.38. 


1.2.39, 


2.40. 


2.41. 


242. 


Joga-se uma moeda três vezes, Se X é uma variável aleatória que representa o número de 
caras, (2) construa uma tabela de distribuição de probabilidade de X e (b) faça o gráfico 
de distribuição. 


Uma urna contém 5 bolas brancas e 3 pretas. Extraem-se duas bolas aleatoriamente, sem 
reposição. Seja X o número de bolas brancas. (а) Determine a distribuigáo de probabili- 
dade de X, (b) faça o gráfico de distribuição. 


Faça o Problema 2.39, se as extrações são feitas com reposição. 


Seja Z uma variável aleatória que represente o número de caras menos о número de co- 
roas em duas jogadas de uma moeda “honesta”. Determine a distribuição de probabili- 
dade de Z. Compare com os resultados dos Exemplos 2.1 e 2.2. 


Seja X uma variável aleatória que represente o número de ases em uma extração aleatória 
de 4 cartas de um baralho usual de 52 cartas. (a) Construa uma tabela exibindo a distri- 
buição de probabilidade de X, (b) faça o gráfico de distribuição. 


FUNÇÕES DE DISTRIBUIÇÃO DISCRETAS 


2.43, 


A Tabela 2-7 exibe a função de probabilidade de uma variável aleatória X. (a) Construa 
uma tabela da. função de distribuição de X, (b) faça o gráfico de distribuição de X. 


Tábua 2-7 Tábua 2-8 
x 1 2 3 | 


z 
He) | 1/2 | 1/8 | vã | ES 


2.46. 


>) | 5 A 
ds pes ) Й 
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Obtenha a função de distribuição e seu gráfico, para (a) Problema 2.28, (b) Problema 
2.39, (c) Problema 2,40. 


. Obtenha a função de distribuição e seu gráfico, para (e) Problema 2.41, (b) Problema 


242. 


A Tábua 2-8 exibe a função de distribuição de uma variável aleatória X. Determine 


(a) a função de probabilidade, (b) PU SX < 3), (c) Р(Х 2:2), (ду Р(Х <3), (e) Р(Х 7 1,4). 


VARIÁVEIS ALEATÓRIAS CONTINUAS E 
DISTRIBUICÓES DE PROBABILIDADE 


247. 


^248. 


249. 


2.50. 


2.52. 


Uma variável aleatória X, tem função de densidade 


ge — wl 


Ја) = | 0 scü 
Determine (a) a constante с, (b) Р(1 < X < 2), (c) P(X>3), (d) Р(Х « 1). 


Determine a função de distribuição do Problema 2.47, Faça o gráfico das funções de den- 
sidade e de distribuição, indicando as relações entre as mesmas. 


Uma variável aleatória X tem função de densidade 


ох? 1= х= 2 
fa) = ex DALE di 
0 em caso contrário 


Determine (a) a constante c, (b) P(X > 2), (c) P(1/2< X < 3/2). 


Determine a função de distribuição da variável aleatória X do Problema 2.49. 


51. A função de distribuição de uma variável aleatória X é dada por: 


ex 0<<3 
Fla) = 1 = 28 
0 a<o 


Se Р(Х = 8) = 0 determine (a) a constante c, (b) a função de densidade, (c) Р(Х > 1), 
(d) Р(1<Х < 9). AL 
A função 


0 em caso contrário 


c(1—3?) 0<we<l 
F(z) = { 


pode ser uma função de distribuição? Explique. 
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2.53, Seja X uma variável aleatória com função de densidade dada por: 


[es 0<1<2 
fla) = lo 


em caso contrário 


Determine (a) a constante c, (b) Рф < X < 3) (e) Р(Х > 1), (d) a função de dis- 
tribuição. 


DISTRIBUIÇÕES CONJUNTAS E VARIÁVEIS INDEPENDENTES 


2.54. A função de probabilidade conjunta de duas variáveis aleatórias discretas X e Y é f (x, y) = 
= сху parax=1,2,3ey= 1,2, 3, e zero em todos os outros casos. Determine (a) a 
constante c, (b) Р(Х = 2, Y =3), (с) PA «x«2,Y«2, (d Р(Х 2), 

(e) PIY <2), () PIX=D, (g) P(Y = 3). 

2.55. Determine as funções de probabilidade marginal de (a) X e (b) Y das variáveis aleatórias 

do Problema 2.54. (c) Determine se X e Y são ou não independentes. 


2.56. Prove que as variáveis discretas X e Y são independentes se e somente se, para todos os 
valores de x e y, sua função de probabilidade conjunta pode expressar-se como o produ- 


to de uma função x somente por uma função de y somente. 


2.57. Sejam X e Y variáveis aleatórias contínuas com função de densidade conjunta 


[deg 0X4<1 0<y <1 
Kad = le 


em caso contrário 


Determine (a) a constante c, (b) P(X < 4, Y 4), () Р(}< Х< 4), (d) PY < 4), 
(e) se X e Y são independentes. 


2.58. Determine as funções de distribuição marginal (q) de X, (b) de Y, para a função de densi- 
dade do Problema 2.57. 


2.59 Prove o resultado do Problema 2.56 para o caso de as variáveis serem contínuas. 


DISTRIBUIÇÕES CONDICIONAIS E FUNÇÕES DE DENSIDADE 


2.60. Determine a função de probabilidade condicional (a) de X dado Y, (b) de Y dado X, para 
a distribuição do Problema. 2.54, 


2.61. Seja 
ж + у 05х51, 0 1 
fe) = |: y seat SEN 
em caso contrário 


2.62. 


2.63. 
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Determine a função de densidade condicional de (a) X dado Y, (b) Y dado X. 


Determine a densidade condicional de (a) X dado Y, (b) Y dado X, para a distribuição do 
Problema 2.57. 


Seja 


esto 220, у 20 


0 em caso contrário 


Hay) = | 


a função de densidade conjunta de X e Y. Determine а fungáo de densidade condicional 
de (a) X dado Y, (b) Y dado X. 


MUDANCA DE VARIÁVEIS 


‚ 2.64. 


2.65. 


` 266. 


2.67. 


Seja X uma v.a. com função de densidade 


fe? x0 
fa) = lo O 
Determine a função de densidade de Y = X?. 


(a) Se a função de densidade de X é f (x), determine а função de densidade de Y «(b) 
Ilustre o resultado da parte (a) escolhendo 


[1€ rz20 
fo = do PETI 


e confira o resultado. 
Prove o Teorema 2-2, pág. 63. 


Prove o Teorema 2-3, pág. 63, para os casos 


(а) vu) < 0, (0) viu) 20, (e) vu) «0. 


. Se X tem função de densidade f(x) = (2z)-!/2e-7/2, —= < w < «, determine a 


função de densidade de Y = X?. 


. Verifique que a integral de g,(u) no Método 1 do Problema 2.21 é igual a 1. 


Se a densidade de X éf(x) = 1/m(a2 +1), —9 < v < 2, determine a densidade de 
Y = tan`! X. 


Complete o cálculo de g,(u) no Método 2 do Problema 2.21 e confira o resultado. 


. Seja uma variável aleatória X com densidade dada por 
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[uz =1<ex<1 
fi) = le 


em caso contrário 
j Determine a densidade de (a) 3X — 2, (b) X3 +1. 


2.73. Verifique, por integração direta, a função de densidade do Problema 2:22. 


2.74. Sejam X e Y com função de densidade conjunta dada por 


euro 220, y>0 


0 em caso contrário 


Ham) = | 


Se U = X/Y, V = X + Y, determine a função de densidade conjunta de U e V. 


2.75. Use o Problema 2.22 para determinar a fungáo de densidade de (a) U — XY?, 
(b V = XYY. 


2.76. Sejam X e Y variáveis aleatórias com função de densidade conjunta dada por 
f(x, y) = (т) let), —o La< o, —o < y < 9, 


Se R e O são novas variáveis aleatórias tais que X= Р cos) Y = R sen Ө, mostre que a 
função de densidade de R é dada por 5 


reto r>0 


gir) lo gu 


2.77. Seja 


[t 0<1<1, 0<0<1 


| 0 еп caso contrário 


Hey) = 


a função de densidade conjunta de X e Y. Determine a função de densidade deZ= XY. 


CONVOLUÇÕES 
2.78. Sejam X e Y variáveis aleatórias independentes identicamente distribuídas com função de 
densidade 
f 1 о<1<1 
| Wow 1 0 ет caso contrário 


Determine a função da densidade de X + Y e verifique o resultado. 


2.79. 


2.80. 


2.81. 
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Sejam X e Y variáveis aleatórias independentes identicamente distribuídas com função 
de densidade 


T et tz0 
É = 
Ho 1 0 em caso contrário 
Determine a função de densidade de X + Y e verifique o resultado. 


Prove que (а) fi * a+) = fi* fact fit (0) ht (a * fà = (Р fa) * fa 


Faça o Problema 2.21, fazendo primeiro a substituição 2Y = Z e, em seguida, utilizando 
convoluções, para determinar a função de densidade de U = X + Z. 


Se as variáveis aleatórias X4 e X», independentes, são identicamente distribuídas com 
funções de densidade 
120 


ipu 
fü = Lo 1<0 


determine a função de densidade de X, + Xy. 


APLICAÇÕES À PROBABILIDADE GEOMÉTRICA 


2.83. 


2.84. 


2.85. 


Escolhem-se ao acaso dois pontos em um segmento de reta de comprimento а > 0. 
Determine a probabilidade de que três segmentos escolhidos possam constituir os lados 


de um triângulo. 


Sabe-se que um ônibus deve chegar a certa localidade entre 15h e 15h 30 min. Uma pes- 
soa resolve ir a essa localidade, naquele intervalo de tempo, e esperar no máximo 5 minu- 
tos pela chegada do ônibus. Se ela perder o ônibus, seguirá pelo metrô. Qual a probabi- 
lidade de ela perder o ônibus? 


Dois segmentos de reta AB e CD têm comprimentos 8 e 6 (unidades), respectivamente, 
Escolhem-se ao acaso dois pontos, P e Q, nos segmentos AB e CD, respectivamente, Mos- 
tre que a probabilidade de a área do triângulo de altura AP e base CQ ser maior de que 12 
unidades de área é (1 — In 2)/2. 


PROBLEMAS DIVERSOS 


2.86. 


Seja (к) = c/3%, 2=1,2,..., а função de probabilidade de uma variável aleatória 
X. (a) Determine c. (b) Determine a função de distribuição. (c) Faça o gráfico da função 
de probabilidade e da função de distribuição. (d) Determine P (X > 3), (e) Determine 
P(2<X <5). 


a 
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2.87. Seja 


схе-ї 20 
fa) = | 


0 em caso contrário 


| a função de densidade de uma variável aleatória Y. (a) Determine с, (b) Determine a fun- 
ção de distribuição. (c) Faça o gráfico da função de densidade e da função de distribui- 
co. (d) Determine Р(Х 21). (e) Determine P(2<X<3). 


2.88." A função de probabilidade de uma variável aleatória X é dada por 


2р x=i 
p = @ 
fla) = 
4р x=8 
0 em caso contrário 


d onde p é considerado constante. Determine (a) P(0 & X < 3), (b) P(X > 1). 
2.89. (a) Prove que, para uma constante adequada c, 
[0 x <0 
(el-e х>0 


é a função de distribuição de uma v.a. X; determine c. (b) Determine P(1 < X <2). 


F(x) 


2.90. Uma variável aleatória X tem função de densidade 


paa x) 0<x*<l 


19 = 1 0 em caso contrátio 


Determine a função de densidade da variável aleatória Y = X 26 verifique seu resultado. 


2.91. Duas variáveis aleatórias independentes X e Y têm, respectivamente, as funções de 
densidade 
f сё? PU суе?" y 20 
) = 4 = 
Fa Lo as gin) lo PT 
Determine (а) сі e о, (b) P(X +Y > 1), (e) Pac X «2, YZ D, 
(d Pa «X«2), (e) P(Y 21). 
f laty) 0<x<1, 0<y<2 


Hey) = 


1 0 em caso contrário 


2.92. No Problema 2.91, qual a relação entre os resultados (c), (d) e (e)? Justifique sua res- 
| posta. 


| 2.93. Sejam X e Y variáveis aleatórias com função de densidade conjunta 
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Determine (a) a constante c, (b) P(X > 4, Y < 3), (c) a função de densidade (margi- 
nal) de X, (d) a função de densidade (marginal) de Y. 


2.94. No Problema 2.93,é P(X > 4 


= P(X > 4) P(Y < 3), Por que? 
2 
2.95. No Problema 2.91, determine a função de densidade (a) de X ,(b)de X+Y. 


2.96. Sejam X e Y com função de densidade conjunta dada por 


[ty 0<x<y, 0 < 
Қ, у) = Lo 


y<1 
em caso contrário 
(a) Determine se X e Y são independentes, (5) Determine P(X > 1). (c) Determine 
Р(Х «4, Y > 1). (d) Determine P(X + Y > 4). 
2.97. Generalize (a) O Probl. 2.78 e (b) о Probl, 2.79 para o caso de três ou mais variáveis. 
2.98. Sejam X e Y variáveis aleatórias independentes identicamente distribuídas com fungáo 


de densidade f(u) = (27) V2e-%/2, —» < и < =. Determine a função de densi- 
dade de Z = X? + Y?. 


2.99. A Tábua 2-9 dá a função de probabilidade Tábua 2-9 
conjunta das variáveis aleatórias X e Y. (a) De- 
termine as funções de probabilidade marginal 
de X c Y. (b) Determine P(1& X «3, 
Y 21). (c) Determine se X e Y são inde- 
pendentes. 


2.100. Suponha que a função de probabilidade con- 
junta das variáveis aleatórias X e Y seja dada 
por 


f exu 0<1<2 0€y &x 
fiw = lo 


em caso contrário 


(a) Determine se X e Y são independentes. (b) Determine P(5 < X « 1). . (c) Deter- 
mine P(Y z 1). (d) Determine PIA <X<1,Y=1). 


2.101.Sejam X e Y variáveis aleatórias independentes cada uma com função de densidade 


Mec 
u! 


Қи) = EE AA 


onde X > 0. Prove que a função de densidade de X + Y é 


gu) = enem WILL us 


li 
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2.102. Qual o análogo do Teorema da convolução, para o caso de variáveis discretas? liustre sua 
resposta utilizando o Problema 2.101. 


2.103. Quebra-se em dois pedaços uma vara de comprimento L. Qual a probabilidade de um dos 
pedaços ter comprimento superior ao dobro do comprimento do outro? Indique detalha- 
damente as hipóteses feitas. Discuta se tais hipóteses são realistas, e indique como pode- 
ria melhorá-las em caso negativo. 


2.104. Um assoalho é feito de quadrados de lado [. Joga-se uma agulha de comprimento а «tL 
Prove que a probabilidade de a agulha interceptar ao menos um lado é а(4/ — a)/zl". 


2.105. Para uma agulha de comprimento dado, qual deveria ser o comprimento do lado do qua- 
drado do Problema 2.104 para que a probabilidade de interceptação seja máxima? Expli- 
que sua resposta. 


2.106. Seja И 
Hoya = 


em caso contrário 
a função de densidade conjunta de três variáveis aleatórias X, Y e Z. Determine 


(а) PX »1,Y«4,Z274, (b) РИ < Хү). 


2.107. Dirige-se um fluxo cilíndrico de partículas de raio a рага um alvo hemisférico ABC cen- 
trado em O (Fig. 2-32). Suponha a distribuição das partículas dada por 


to) = 


(Ша Q4 
Lo em caso contrário 


onde r é a distância a contar do eixo OB. Mostre que a distribuição das partículas no alvo 
é dada por 


[cose 0<9<7/2 


90) = + - 
0 em caso contrário 


onde 0 é o ángulo que a reta OP (de O a um ponto arbitrário P do alvo) faz com o eixo, 


Fig. 2-32 
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2.108.No Problema 2.107, determine a probabilidade de uma partícula atingir o alvo entre 
0 = 0e 8 = mA. 
2.109. Suponha que as variáveis aleatórias X, Y e Z tenham função de densidade conjunta dada 


por 
oered, 0<y<1, 0<z<i 


сов т) cos zz > 


[ 1 —.£b; 
Y E - 

i ) 19 em caso contrário 

Mostre que, embora se trate de variávcis aleatórias independentes duas a duas (i.e., suas 

funções de densidade marginal podem ser fatoradas), as três variáveis, consideradas con- 


juntamente, não são independentes. 


capítulo 3 


Esperanca Matemática 


DEFINIÇÃO DE ESPERANÇA MATEMÁTICA 


Conceito de grande importância em probabilidade e estatística £ о de esperan- 
ça matemática, valor esperado, ou simplesmente esperança de uma variável aleató- 
ria. Para uma variável aleatória discreta X que pode tomar os valores XX 
define-se a esperanga de X como 


EU) = арха) + + РК) = È ара) (1) 


ou equivalentemente, se P(X = x;) = (2), 


n 


ED) = aja) + + (а) = xm = Eef) (8) 


j=1 


onde o último somatório abrange todos os valores apropriados de x, Como caso es- 
pecial de (2), quando as probabilidades são todas iguais, temos 


dl e ++, a 
nii (8) 


E(X) = 


i 
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que é a média aritmética, ou simplesmente média, de Xe Xn 
Para uma variável aleatória contínua X com função de densidade f(x), define- 
se a esperança como 


EX) = f a f(x) de (4) 


Note-se a analogia com (2) 

A esperança de X é comumente designada a média de X, denotando-se por 
и x, ou simplesmente и desde que não paire dúvida quanto à variável aleatória en- 
volvida. 

A média ou esperança de X ё um valor único, que atua como representante, 
ou média, dos valores de X, e por essa razão costuma-se chamar uma medida de 
tendência central. À pág. 120 consideraremos outras medidas. | 


EXEMPLO 3.1. Suponha-se um jogo disputado com um único dado honesto, em que um joga- 
dor ganha $20 se aparece 2, $40 se aparece 4, perde $30 se aparece 6, e não ganha nem perde 
se aparece qualquer das outras faces, Determine a esperança de seu ganho. 

Seja X uma variável aleatória que dá a quantia ganha em qualquer jogada. As importân- 
cias possíveis associadas ao aparecimento de 1, 2,... ,6 580 21, *5,...,9g respectivamente, 
enquanto que as probabilidades respectivas são (221), f (2), . . .„ 6): A Tábua 3-1 exibe a 
funcáo de probabilidade de X. O valor esperado é, pois 


EQ) = e(t) " Ө + e(t) + ao (+) + e(t) + e(t) а 


en 


Tábua 3-1 
2j 0 +20 0 +40 0 30 
Ка) 1/6 1/6 1/6 1/6 1/6 1/6 


Segue-se que o jogador pode esperar ganhar $5. Em um jogo equitativo, pois, essa seria a 
importáncia de sua aposta. 


EXEMPLO 3.2. A função de densidade de uma variável aleatória de X é dada por 


far 0902 


fle) 


O valor esperado de X é então 


tle 
E 
a 
& 
il 


EX) > B sf) de = EC 
| Js 


ESPERANÇA MATEMÁTICA 109 


FUNÇÕES DE VARIÁVEIS ALEATÓRIAS 


Seja X uma v.a. Então Y = g(X) ё também uma v.a. segue-se que 


P(Y-w)- Y P(X=14) 


te | Gu) 


L Se X uma variável aleatória discreta com função de probabilidade f(x), 
então 


E[g(X) = аба) Ha) + (з) Tia) + + gs) Flan) 


8 È se) fe) = Yamila) (5) 


2 Se X ё uma variável aleatória contínua com função de probabilidade 
f(x), então 


EO) = fan dz (6) 


Generalizam-se facilmente tais resultados para o caso de funções de duas ou 
mais variáveis aleatórias. Assim, p.ex., se X e Y são duas variáveis aleatórias contí- 
nuas com função de densidade conjunta f (x, y), a esperança de £( X, Y), € dada por 


Ea = $ $ ўа юган e 
EXEMPLO 3.3. Se X é variável aleatória do Exemplo 3.2, 
E(X:-2X) — T з а) = f. (Be? -s (3s) de =P 
* ШАП P 


ALGUNS TEOREMAS SOBRE ESPERANCA MATEMÁTICA 


Teorema 3-1: Se c € uma constante, 
E(cX) = cE(X) (8) 


Teorema 3-2: Se X e Y são variáveis aleatórias, então 


E(X+Y) = E(X) + EO) (9) 
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Teorema 3-3: Se X e Y são variáveis alcatórias independentes, então 
Е(ХҮ) = E(X) E(Y) (10) 


Generalizam-se facilmente estes teoremas. 


A VARIÂNCIA E O DESVIO PADRÃO 


Já vimos (pág. 108) que a esperança de uma variável aleatória X é frequente- 
mente designada média с denotada por и. Outra quantidade de grande importância 
em probabilidade e estatística é a variância, definida como 


Var(X) = ЕХ – 1) (11) 


A variáncia é um número náo negativo. A raiz quadrada positiva da variáncia é cha- 
mada desvio padráo e € dado por 


fa = VYar(X) = vE[(X — uy] (12) 
Não havendo perigo de confusão, denota-se o desvio padrão рого ao invés de 0,;a 
variància é então 02. 


Se X € uma variável aleatória discreta com função de probabilidade f (x), 
então a variância de X é dada por 


o = E(X- = titia) = У 7) (13) 


No caso especial de (13) onde as probabilidades são todas iguais, temos 
e [s УР (Bo а)? Ч + (£a — п) (14) 


que é variància de um conjunto de n números x, , ‚хт 
Se X é uma variável aleatória contínua com função de densidade f(x), então a 
variância de X é dada por 


o = E(X-4y| = f |a fin de (15) 


A variância (ou desvio padrão) é uma medida da dispersão dos valores da variável 
aleatória em redor da média u . Se os valores tendem a concentrar-se próximos da 
média, a variância é pequena; mas se os valores tendem a afastar-se da média, a 
variância é grande. A situação é indicada graficamente na Fig. 3-1 para о caso de 
duas distribuições contínuas com a mesma média и 
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pequena variáncia 


„= grande variáncia 


и 


Fig. 3-1 
EXEMPLO 3.4. Determine a variáncia e o desvio padráo da variável aleatória do Exemplo 3.2. 
Como se viu no Exemplo 3.2, a média ё  = E(X) = 4/3. Então a variância ё dada 
por / 2 / 2 
а. Ж „Жү | ы ш „ЖҮ РЭ 
a 8 = (не - 
" ч 2 у 
e o desvio padrão é oc = * = ^an 


Note-se que se X tem uma dada dimensdo, ou unidade (p.ex., centímetros), a 
unidade da variância de X é cm? ao passo que o desvio padrão tem a mesma 
unidade que X, i.e., cm. Por tal razão ё que se utiliza preferentemente o desvio 
padrão. | 


ALGUNS TEOREMAS SOBRE A VARIANCIA 


Teorema 3-4: 
о = Е[(Х-– п) = EX) – а = Е(Х?) — [E(X)]2 (16) 
onde u = E(X). 


Teorema 3-5: Se c é uma constante 


Var(cX) = c Var(X) (17) 


Teorema 3-6: A quantidade E[(X — a)?] é mínima quando a = р = E(X). 
Teorema 3-7: Se X e Y são variáveis aleatórias independentes, 
Var(X+Y) = Var(X) + Var(Y) ou оўу = ох +0; (18) 
Var(X—Y) = Var(X) +Var(Y) ou o, = оў оу (19) 
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Generaliza-se facilmente o Teorema 3-7 ao caso de mais de duas variáveis in- 
dependentes. Em palavras, a variáncia de uma soma de variáveis aleatórias é igual à 
soma de suas variâncias. 


VARIÁVEIS ALEATÓRIAS PADRONIZADAS 


Seja X uma v.a. com média р e desvio padrão т (o > 0). Podemos então de- 
finir uma variável aleatória padronizada, associada àquela, e dada por 


Ep 


o 


(20) 


Propriedade importante de X* & que sua média é zero e sua variância é1 (donde o 
nome padronizada); isto é 


E(X*) = 0 Var(X*) = 1 (21) 


Outra propriedade importante de X * ё que ё uma quantidade adimensional, isto é, 
não tem unidade de medida, embora X a possua. 

Os valores de uma variável padrinizada são às vezes chamados escores padrões; 
diz-se então que X está expressa em unidades padrão (i.e., toma-se o como unidade 
para medir X — y). 

As variáveis normalizadas, ou padronizadas, são úteis na comparação de distri- 
buições diferentes. 


MOMENTOS 


O momento de ordem г de uma variável aleatória em relação à média y , tam- 
bém chamado momento central de ordem ғ, ё definido por 


n, El(X — uy] (22) 
onde r=0, 1, 2,... . Segue-se que y, = 1, m = Оер, = o, isto ё, o segundo 


momento central (ou segundo momento em relação à média) é a variância Temos 
„ = Elie) = E (0—0) 709) (variável discreta) (23) 
E 


B = y (x — п)" f(x) de (variável contínua) (24) 


O momento de ordem r em relação à origem é definido como 
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ш = E(X’) (25) 


onder= 0,1,2,... ;em tal caso há fórmulas análogas a (23) e (24) comu = 0. 


A relação entre esses momentos é expressa por 
r ¿[Y A 
Bs = Mp (Du "oram ETAS +e Hiig (26) 
Como casos especiais temos, usando ш = p e ph = 1, 


& = abu 
п = 14 Зр + 2p (27) 
pa = 17 Auge + бии? — Spot 


FUNÇÕES GERATRIZES DE MOMENTOS 


Define-se a função geratriz de momentos de X como 
M,(t) = Ele*) (28) 


| isto é, 


tuf(m) = Y evf(w) (variável discreta) (29) 


Mt) = f. e'f(a) de (variável contínua) (30) 


Pode-se mostrar que o desenvolvimento tayloriano (Problema 3.1 5(а)) é 


MA) = 1+ pta to T Жы: (31) 


A razão da designação função geratriz de momentos é que os coeficientes do desen- 
volvimento acima nos permitem determinar os momentos Do mesmo desenvolvi- 


mento, pode-se mostrar (Problema 3.15(5)) que 


i" 4 
u = МА | (32) 
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isto ё, д. é a derivada de ordem ғ de M,(t) calculada em z - 0. Não havendo pe- 
rigo de confusão, costuma-se escrever M(t) em lugar de М, (0). 


ALGUNS TEOREMAS SOBRE FUNCOES 
GERATRIZES DE MOMENTOS 


Teorema 3-8: Se M,(t) é a função geratriz de momentos de у. a. X e a e b (+= 0) 
são constantes, então a função geratriz de momentos de (X+a)/bé 


Marant) = ew) (33) 


Teorema 3-9: Se X e Y são variáveis aleatórias independentes com funções geratri- 
zes de momentos M,(t) е M,(t) respectivamente, então 


Meryl) = MAMAS) (84) 


Generalizam-se facilmente os resultados do Teorema 3-9 ao caso de mais de duas va- 
riáveis aleatórias independentes Ou seja, a função geratriz de momentos de uma so- 
ma de variáveis aleatórias é igual ao produto de suas funções geratrizes de mo- 
mentos 


Teorema 3-10:/Unicidade) :Sejam X e Y variáveis aleatórias com funções geratrizes 
de momentos M,(f) e M,(t) respectivamente Então, X e Y te- 
rão a mesma distribuição de probabilidade se e somente se М, (й) = 
= M,(t) identicamente. 


FUNCOES CAR ACTERÍSTICAS 


Fazendo 7 = ico, (onde i é a unidade imaginária) na função geratriz de mo- 
mentos, obtemos uma função importantíssima chamada função característica. 
Denotamo-la por 


pxl) = Mio) = (е) (85) 


Segue-se que 


Pulo) = Xen) = У) eiozf(x) (variável discreta) (86) 


belo) = f. e":f(x)dz (variável contínua) (37) 
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Os resultados correspondentes (31) e (32) se tornam 
Я w? аф wr 
duelo) = 1+ їо pot Hugo (38) 


onde 
ко 1yi" dr 
м = yr tal. 


Não havendo perigo de confusão, costuma-se escrever ф (w)em lugar de dy (оо). 
Os teoremas relativos às funções características, correspondentes aos Téore- 
mas 3-8, 39 e 3-10, são : 


Teorema 3-11:Se ¿,(w) ё a função característica da variável aleatória X e a e b 
(b = 0) são constantes, então a função característica de (X + a)yb ё 


tel o) (40) 


Teorema 3-12:Se X e Y são variáveis aleatórias independentes com funções caracte- 
rísticas xlo) e $,(v) respectivamente, então 


$xiy (S) = x bylo) (41) 
Mais geralmente, a função característica de uma soma das variáveis aleatórias 
independentes é igual ao produto de suas funções características 


Teorema 3-13: (Unicidade): Sejam X e Y variáveis aleatórias com funções caracte- 
rísticas (co) e 9y(co) respectivamente. Então X e Y terão a mesma 
distribuição de probabilidade se e somente sed (co) =фу(оо) identica- 
mente. 


Uma razão importante para a introdução da função característica é que (37) 
representa a transformada de Fourier da função de densidade f (x). Pela teoria das 
transformadas de Fourier pode-se determinar a função de densidade a partir da fun- 
ção característica. De fato, 


fa) = e. ес do) do He) 


que costuma chamar-se fórmula de inversão ou transformada inversa de Fourier. De 
maneira análoga, pode-se mostrar, no caso discreto, que a função de probabilidades 
f (x) pode ser obtida de (36) mediante o emprego de séries de Fourier (que consti- 
tuem, para o caso discreto, o análogo da integral de Fourier). V, Problema 3.39. 


| 
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Outra razão para o emprego da função característica é que ela sempre existe, 
ao passo que a função geratriz de momentos pode não existir. 


VARIÂNCIA DE DISTRIBUIÇÕES CONJUNTAS. COVARIÂNCIA 


Os resultados acima, relativos ao caso de uma variável, podem estender-se ao 
caso de duas ou mais variáveis. Assim, p.ex., se X c Y são duas variáveis aleatórias 
contínuas com função de densidade conjunta f (x, y), as médias ou esperanças de 


XeY são ^ * 
кх = E(X) = f. f a f(z, y) de dy, 


ny = E(Y) = I S y f(x, y) de dy (43) - 
e as variancias são "m 
з = ЕХ) = } {| Ge fea de dy 
mous (44) 
Ф = EL ff аав 
Outra grandeza que surge по caso de duas variáveis Хе У éa covariáncia, 


definida рог 
ow = Cov(X, Y) = EX — ¿Y — ng) (45) 


Em termos de função de densidade conjunta f (x, y); temos 
„= S SO eg i fers dedy (46) 


Observações análogas valem para o caso de duas variáveis aleatórias discretas. 
Em tal caso, (43) e (46) são substituídas por 


„= ХУ 060) у= E Уу) (47) 
ow 7 У E O-U m) 0) (48) 


onde os somatórios se estendem sobre todos os valores discretos de X e Y. 
Eis alguns teoremas importantes sobre a covariância 


Teorema 3-14: 


оуу = E(XY) - IX) E(Y) = E(XY) — кунү (49) 
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Teorema 3-15:Se X e Y são variáveis aleatórias independentes 


oxy = Cov(X, Y) = 0 (50) 

Teorema 3-16: ч m " 
Var(X +Y) = Var(X) + Var(Y) = 2 Cov (X,Y) (51) 
Su Rey = ох + ту = 20у (52) 


Teorema 3-17: (53) 


[exe] < 0707 


A recíproca do Teorema 3-15 náo é necessariamente verdadeira Se 
X e Y sáo independentes, o Teorema 3-16 se reduz ao Teorema 3-7. 


COEFICIENTE DE CORRELAÇÃO 


Se X e Y são independentes, então Cov (X, Y) = e,, = 0. Por outro lado, 
se X e Y são completamente dependentes, por exemplo, quando X = Y, Cov(X, Y) 


= сүү = субу. 


Isto nos conduz а uma medida da dependência das variáveis X e Y dada рог 


que é uma quantidade adimensional Chamamos p o coeficiente de correlação. Do 
Teorema 3-17, vemos que —1 <p < 1. Se p=0 (i.e., se a covariância é zero), di- 
zemos que as variáveis X e Y são não-correlacionadas Em tal caso, porém, as variá- 
veis podem ou não ser independentes No Capítulo 8 discutiremos com mais detalhe 
o coeficiente de correlação. 


ESPERANÇA, VARIÂNCIA E MOMENTOS CONDICIONAIS 
Se X e Y têm função de densidade conjunta f (x, y), então, conforme vimos 
no cap. 2, a função de densidade condicional de Y dado X é flay = 


= f(z,y)/fi (x) onde fi() é a função de densidade marginal de X . Podemos defi- 
air a esperança condicional, ou média condicional, de Y dado X por 


mYix=w%) = f^ уйы) (55) 


li 
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onde “X = x” deve ser interpretado com Y < X <Y+ dx no caso contínuo 
Os Teoremas 3-1, 3-2 e 3-3 também valem para a esperança condicional 
Têm-se as seguintes propriedades : 


1. EY X-r) = E(Y) quando Хе Y sáo independentes 


= x) fiw) dx 


Em geral € mais conveniente calcular as esperangas matemáticas utilizando-se a 
Propriedade 2, ao invés de diretamente. 


EXEMPLO 3.5. O temp» médio de viagem a uma cidade distante é de c horas por automóvel 
ou b horas por ônibus. Uma pessoa, incapaz de decidir se deve ir de carro ou de ônibus, jogá 
uma moeda. Qual seu tempo esperado de viagem? 

Temos aqui uma distribuição conjunta de resultado da jogada da moeda, X, edo tempo 
de viagem Y, Y = Y carro se X =0 e Y = Yónibus se X= 1. Presumivelmente, tanto Y carro Como 
Yónibus são independentes de X, de modo que, pela Propriedade 1 acima 


BE =) = (шд. К =D = Ego = * 
e va # ы = 4 р = 7, 
EY IX =1) = ElYanibus Y = D = EOYonibus) ^ ^ 


Então a Propriedade 2 (com a integral substituída por uma soma) dá 


cb 


2 


E(Y) = E(Y|X = 0 РХ — 0) 4 EQYiX-I1)B(QX—1) = 


De maneira análoga podemos definir a variância condicional de Y dado X por 


= f^ шоли dy (56) 


onde uz = E(Y | X =x). Podemos também definir o momento condicional de ordem 
r de Y dado X em relação a qualquer valor a por 


EQY-ariXos] = | аә) du (57) 


Aplicam-se aos momentos ё variância condicional os teoremas usuais relativos aos 
momentos e à variância. 


DESIGUALDADE DE TCHEBICHEV 


Um teorema de grande importância em probabilidade e estatística, que revela 


ESPERANCA MATEMÁTICA 119 


uma propriedade geral de variáveis aleatórias contínuas ou discretas com média e 
sariáncia finitas, é a desigualdade de Tchebichev. 


Teorema 3-18 (Desigualdade de Tchebichev) :Seja X uma variável aleatória (discreta 
ou contínua) com média и e variância o^, ambas finitas Então, se e é 
um número positivo, 


4 


PIX-4>) < © (58) 


ou, com «= ko, 
1 
72 
EXEMPLO 3.6. Fazendo k = 2 na desigualdade de Tchebichey (59), vemos que 
P(X—4 22e < 0,25 ош РХ <2) > 0,75 


Em palavras, a probabilidade de X diferir de sua média em mais de dois desvios padrões é infe- 
or ou, no máximo, igual a 0,25; equivalentemente, a probabilidade de X estar compreendido 
жю intervalo de dois desvios padrões a contar de sua média, é superior ou, no mínimo, igual a 
2,75. Tal fato é tanto mais notável quanto se considerarmos que nem sequer especificamos а 
Esstribuição de probabilidade de X. 


РХ u| > ko) < (59) 


LEI DOS GRANDES NÚMEROS 


O teorema seguinte,conhecido como lei dos grandes números, é uma conse- 
gència interessante da desigualdade de Tchebichev. 


Teorema 3-19 (Lei dos Grandes Números) Sejam Xi, Xs, ... variáveis aleatórias 
(discretas ou contínuas) mutuamente independentes, cada uma com 
média и e variância 0”, finitas Então, se 


B= Krt te t (n=1,2,...), 


lim HEED = 0 (60) 


Сото S/n é a média aritmética de X,, ... Xy, o teorema afirma que a pro- 
Babilidade de a média aritmética S„/n diferir de seu valor esperado и de mais 
de e tende para zero quando m > o, Um resultado mais forte, que se poderia 
esperar, é que lim Sn/n = ри, mas tal resultado é, na realidade, falso. Pode-se, 


no 


entretanto, demonstrar que lim S,/n = y com probabilidade igual a um. Este 


no 


-— Ó—— € 
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resultado é por vezes denominado lei forte dos grandes números, e, em contra- 
posição, o Teorema 3-19 é designado lei fraca dos grandes números. A referéncia 
“lei dos grandes números”, sem especificação, indica a lei fraca dos grandes nú- 
meros. 


OUTRAS MEDIDAS DE TENDÊNCIA CENTRAL 


Como já sabemos, a média ou esperanga de uma v.a. X dá uma medida de ten- 
dência central dos valores de uma distribuição. Conquanto a média seja a mais usa- 
da, empregam-se também outras medidas de tendência central, que são a moda e a 


mediana. 


1. Moda. A moda é o valor que ocorre com maior frequência ou, em outras pala- 
vras, O valor que tem maior probabilidade de ocorrência Para tal valor x, f(x) € 
máxima. Por vezes, pode acontecer que haja dois, três ou mais valores com 
probabilidade relativamente grande de ocorrência. Dizemos então, que a distri- 
buição é bimodal, trimodal, ou multimodal. 


2. Mediana. A Mediana é o valor x para o qual P(X < x) = Р(Х >x) = 4. No 
caso de uma distribuigdo contínua, a mediana corresponde a uma ordenada que 
separa a curva de densidade em duas partes, cada uma delas com área igual a 
1/2. No caso de uma distribuigáo discreta, a mediana pode não ser única (v. Pro- 
blema 3.34). 


PERCENTIS 


Pode ser conveniente dividir a 
área sob uma curva de densidade por 
meio de ordenadas de tal modo que a 
área à esquerda de cada ordenada re- 
presente determinada percentagem 
da área total unitária. Os valores cor- 


respondentes a essas áreas chamam-se 
percentis. Assim, p.ex., а área à es- Fig. 3-2 

querda da ordenada em х па Fig3-2 

é a A área à esquerda de x ¡y seria 10% e se designaria como décimo percentil (ou 
também primeiro decil). A mediana é o quinquagésimo percentil (ou quinto decil). 
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OUTRAS MEDIDAS DE DISPERSAO 


Assim como existem outras medidas de tendência central, além da média, há 
também, além do desvio padrão ou da variância, várias outras medidas da dispersão 
dos valores da variável em torno dessas medidas de tendência central As mais co- 
muns são as seguintes : 


1. Intervalo. O intervalo € a diferença entre o maior valor e o menor valor da distri- 
buição. Tal medida será, naturalmente, inütil se um dos extremos for infinito. 


2. Intervalo semi-interquartil. Se Xo25 € Хол; representam, respectivamente, o 
259 e o 75º percentis, a diferença x0,75 — Хов É chamada intervalo interquartil 


& 1(хо,лв — Хош) é О intervalo semi-interquartil (ou semi-intervalo interquar - 
til). 

3. Desvio Médio. O desvio médio (D.M.) de uma variável aleatória X ё a esperança 
de |X — y), i.e. 


DM(X) = E[]|X —n|] Y jul Ho) (variável discreta) 


D.M.(X) 


П] 


E[£-4) = f leal fla) de (variável contínua) 


ASSIMETRIA E ACHATAMENTO 


1. Assimetria. Em geral, uma distribuição não se apresenta simétrica em relação ao 
seu máximo; uma das “caudas” é mais longa que a outra. Se a cauda mais longa 
se situa à direita (Fig. 3-3), a distribuição se diz assimétrica à direita; em caso 
contrário (Fig. 3-4), se diz assimétrica à esquerda. As medidas que descrevem a 
assimetria de uma distribuição chamam-se coeficientes de assimetria, ou simples- 
mente, assimetria. Uma dessas medidas é dada por 

ЕХ] сою 


a = Es 
E 
o? o 


(63) 


que é uma quantidade adimensional. оз será positiva ou negativa, conforme, 
respectivamente, a distribuição seja assimétrica à direita ou à esquerda. No caso 
de uma distribuição simétrica, оз = 0. 


Assimétrica Assimétrica 
à direita à esquerda 


Fig. 33 Fig 34 Fig. 3-5 
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2. Achatamento (Kurtosis): Em certos casos, uma distribuição pode acusar uma 
concentração de valores em redor da média, apresentando um “pico” elevado 
(Fig 3-5, traço contínuo). Em outros casos, à distribuição pode se apresentar re- 
lativamente achatada (Fig 3-5 tracejada). As medidas do grau de achatamento 
de uma distribuição chamam-se coeficientes de achatamento (ou coefiente de 
kurtosis) ou, simplesmente, kurtosis. Uma dessas medidas é dada por 


E-a] . 
ре ço ад (64) 


que é uma quantidade adimensional. Compara-se em geral com a curva normal, 
que tem um coeficiente de kurtosis igual a 3 (v. Cap. 4). V. também Problema 
3.41. 
Podem-se definir também outros coeficientes de assimetria e de achatamento, 
por meio de outras medidas de tendéncia central, mas os que acabamos de definir 
sáo os mais utilizados 


Problemas Resolvidos 


ESPERANÇA DE VARIÁVEIS ALEATÓRIAS 


3.1. Uma loteria dá 200 prêmios de $5,20 prêmios de $25 e 5 prêmios de $ 100. 
Admitindo-se que sejam emitidos e vendidos 10.000 bilhetes, qual o preço 
justo de um bilhete? 


Seja X uma v.a. que denota a Tábua 3-2 
quantia a ser ganha em um bi- 
lhete. A Tábua 3-2 dá os diver- | x (dólares) 
sos valores de X juntamente 
com suas probabilidades. P.ex., 
a probabilidade de obter um dos 
20 bilhetes com prêmio de $25 
é 20/10.000 = 0,002. A esperan- 
ca de X, em dólares, é pois, 

E(X) = (5)(0;09) + (25)(0,002) + (100)(0,0005) + (0)(0,9775) = 0,2 
ou seja, 20 centavos. Assim, o preço justo a pagar por um bilhete é 20 centavos. Como, 
entretanto, deve haver corta margem de lucro, o preço do bilhete deverá ser um pouco 


maior. 
3.2 Determine a esperança da soma de pontos obtidos na jogada de um par de 


dados. 


3.3. 


3.4. 
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Ѕејат X e Y os pontos que aparecem nas faces dos dois dados. Temos 


E(X) = E(Y) = ORRO ee e(4) = i 


Entáo, pelo Teorema 3-2, 
EX+Y) = EX) +Е(Ү) = 7 


Determine a esperança de uma variável aleatória discreta X cuja função de 
probabilidade é dada por 


se) = (5) w-128...) 


Temos 


EX) = Í (0) = + 404) + s( + 
1 
m 


Para obter esta soma, seja E us 


Entáo 

e 1 cs E 1. ES ES " = 
Subtraindo, 38 = + 4 * gt 16 + 1 
Assim, 5 = 2. 


Uma variável aleatória contínua X tem densidade de probabilidade dada por 


m 220 


fe) = 1g — 


Determine (a) E(X), (b) E(X?). 
@ E(X) = ý da = E ¡2% = ut * 
a, (X) S а f(x) da Í x(2072%) de 2 |, 0% da 


o 


Г) (ЧЭ 
LM cê fla) de > ay” 22672: dy 
Теб) - ede) 950) 


E: 
2 


(0) E(X?) 


(7 


d 
2 
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3.5. 


3.6. 


A função de densidade conjunta de duas variáveis aleatórias X e Y & dada por 


Cay/96 0<2<4, і <у<5 
fa = | 


0 em caso contrário 


Determine (а) E(X), (b) E(Y), (c) E(XY), (d) Е(2Х +37). 


(mx) = ff айай = f, i. (59) andy 


"up Di p 
" 2 31 
шк = ff vend - | S, Э = + 


= = 4 -5 
orar = | f «улый = f$) ea) da dy 
mm Lodi 


248 
27 


05100 


(d) E(QX+3Y) = у у (2i + 3y) f(x, y) de dy 
4 5 y 
47 
= aes ахау = E 
Í Í 55) 3 


Outro método, 
(c) Como X e Y são independentes, temos, utilizando (a) e (b) 


E(XY) = EQOEQ) = 3o - 28 


(d) Pelos Teoremas 3-1 e 3-2, pág. 109, justamente com (a) e (b), 


X Р 
EQX--3Y) = 2E(X) + 3E(Y) = a(3)+ (3) -$ 


Prove o Teorema 3-2, pág. 109. 


Seja f (x, y) a função de probabilidade conjunta de X e Y, supostas discretas. 
Então, 
EX+Y) = EXG-wWftew 
tw 


Nu 


225/00 + > 


11 


E(X) + E(Y) 
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Se uma das variáveis é contínua, basta substituir, na demonstração acima, as somas apro- 
priadas por integrais. Note-se que o teorema é verdadeiro, quer X e Y sejam independen- 
tes, quer não. 


3.7. Prove o Teorema 3-3, pág. 110. 


Seja f (х, y) а função de probabilidade conjunta de X e Y, supostas discretas. 
Se X e Y sao independentes, temos f(x,y) = fr(x) fs(u). Assim 


E(XY) = Asi) = > z xy fila) fa) 
= Xbox] 


= ХлВ] 

т 
= E(X)E(Q) 
Se uma das variáveis é contínua basta substituir por integrais as somas correspondentes. 
Note-se que a validade do teorema depende de podermos expressar f (х, y) como produ- 
to de uma função de x por uma função de y, para todo x e y, isto é, depende do fato de 
X e Y serem independentes. No caso de variáveis dependentes, o teorema não é válido 
em geral. 


li 
VARIÂNCIA E DESVIO-PADRÃO 


3.8. Determine (a) a variância e (b) o desvio padrão da soma de pontos obtidos na 
jogada de dois dados 


(a) Referindo-nos ao Problema 3.2, temos E (X) = E (Y)=7/2. Além disso, 


—— "E 1 1 33 _ Bi 
EM?) = EY} = (5) + О o e(5) = % 
Entáo, pelo Teorema 34, 


ж 2 
Ver(X) = Var(y) = É. (9 =. 88 


e, сото X e Y são independentes, o Teorema 3-7 dá 


Var(X4+ Y) = Var(X) + Var(Y) = & 


Ф) axey = o VVar(X Y) = 


M 
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39. Determine (a) a variância e (b) o desvio padrão da variável aleatoria do Pro- 
blema 3.4. 


(a) “Tal como no Problema 3-4, a média de X é u= E(X) — 1. Então a variância é 


Var(X) = EM] = [37 = у, CDL 
D ; H 


4 
Outro método 
Pelo Teorema 34, 
ра i LX i 
Varo = EX] = EU (EP = q (3) =1 
Фф) с = Wart) = E E i 
3.10. Prove o Teorema 3-4, pág. 111. 
Temos  E[(X—,)9)] = E(X?—84X +42) = E(X?) — 24E(X) + p? 


= Е(Х?)— 22440 = Е(Х?) — и 
= E(X?) — [Е(Х)]? 


3.11. Prove o Teorema 3-6, pág. 111. 

ЕХ а] = EUX— + (103 
EX — p)? + AX — диа) + (u= a] 
E(X — à] + 2(и— DE (X — à) + (4 9)? 
= EZ-a?) + (a-a)? 


1 


pois E(X — y) = E(X) — u = 0. Por aí se vé que o mínimo de E((X — a)?] ocorre 
quando (и — a)? = 0, isto é, quando а = п. 


3.12. Se X* = (X — р)/с é uma variável aleatória padronizada (normalizada), 
prove que (a) E(X*) = 0, (5) Var(X*) = 1. 


€) EX) = (Es) = Мид] 
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pois E(X) = p. 


e Yar(X*) = Var (E =) = hm) = 1 


aplicando o Teorema 3-5, pág. 111, e o fato que E((X — 9%] = o. 


3.13. Prove o Teorema 3-7, pág. 111. | 
Уат(Х+Ү) = Ё|{(Х+Ү)— (их + uy] 
= EX лу) + (У— 9 
= E[(X— ux) + AX — их)(У — uy) + (Y — e] 
= EQX- px)?] + 2E(X — (Y — y)] + ERY — ау)? 
= Var(X) + Var (Y) 
utilizando o fato que E[(X— py HE А) = E(X— пу) E(Y — uy) = 0 pois 


X e Y, e, portanto, X — iy e Y — py, são independentes. A prova de (19), pág. 111, 
decorre imediatamente, subsituindo-se Y por —Y e aplicando o Teorema 3-5. 


MOMENTOS E FUNÇÕES GERATRIZES DE MOMENTOS 


3.14. Prove o resultado (26), pág. 113. 
= = E(X- 0] 


= z[x = (ee de эзе de lp) are 


* 
Р я cx, 7 iie + an] 


= EX) — (Decr d as pas db (7) iai 


(usq coi ecos + (rar 
= oai (Dus E Ө? q! 
+ + (rar + (T) ntt 


onde se podem combinar os dois últimos termos para obter (—1)* Mr — Du”. 


3.15. Prove (a) o resultado (31) e (b) o resultado (32), pág. 113. 
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(a) Utilizando o desenvolvimento em série de potências de еч (3, Apêndice A) temos 


2 
My() Elex) = в(1 + ж SP + ке + es) 


Ш 


Ш 


1 + HX) + Fue) +5 EO oe 
з 
= 1b gab ab t ae oe 
(b) Decorre imediatamente do fato, conhecido do cálculo, que, se a série de Taylor de 
f(t) na vizinhança de t =a é " 
fo = >, cnlt— а)" 


Perl 


entáo ёр É ov 
d$ 


3.16. Prove o Teorema 3-9, pág. 114. 


Como X e Y,são independentes, são - no também qualquer função de X e qual- 
quer função de Y entre si. Logo, 


Mx all) E[eGc] = Eee) = E(e'X)E(eY) = Му() My) 


3.17. A v.a. X pode tomar os valores 1 e —1, com probabilidade 4 cada um. Deter- 
mine (a) a função geratriz de momentos e (b) os quatro primeiros momentos 
em relação à origem 


(a) E(eX) = (3) + Ө) Lette D! 
2 E tt 
e =z Ф 
(Б) Temos É op gr Түр + 
"a _ ё Doct 
+ т Pep ga o 
Então (1) 1 t2 t 
ge te Lag bart 
e E B 
Mas 2) М = 1+0 + бот # gp ta ro 


Então, comparando (1) e (2), temos 
220 = 1, 4-0 4=1 


Os momentos ímpares são todos iguais a zero, e os pares todos iguais a 1. 


3.18. Uma variável aleatória X tem função de densidade dada por 
2e" mr20 
дә =| j 
| 0 x<0 
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Determine (а) a função geratriz de momentos e (5) os quatro primeiros mo- 
mentos em relação à origem 


w ae = Eee = f” eode 
= [n er(Ze dr = ay” elt-2z da 
o D 
(1-2) | 
a E = 2 supondo t< 2 


t—2 lo 
(b) Se |t| < 2 temos 
2 m 1 _ t e gB “ 
Пат (Jg 607g И 
B 5 La 
Mas Mo) =1L+ut+ ътт ug Agt 


Assim, comparando termos, и = $, 4 = d; и = i ш =. 


3.19. Determine os quatro primeiros momentos (а) em relação à origem, (b) em re- 
lação à média, para uma variável aleatória cuja função de densidade & 


[4509 – 2)/81 0<r<3 


mé = lo em caso contrário. 
4 (7 8 
(a) ap = ЖЖ) = ES, 208—202) = p = 4 
ae 
щ = E(X?) = &f 0309 — х2) йк = 8 
a f? 216 
u = E(X) = & f, 9%) de = EE 
ef 27 
щ = E(X) = xf 299—0) йк = — 
(b) Utilizando o resultado (27), pág. 113, temos 
щ = 0 
216 8 ay 32 
la = вр so) + 2(5) = 7 


27 210 / 8 8y a 3693 
= 2 j(me(8 sv (38V = 
"T 2 30 а в®() “Us 8750 
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FUNÇÕES CARACTERÍSTICAS 
3.20. Determine a função característica da variável aleatória X do Problema 3.17. 


A função característica é dada por 


E(eieX) = e 3) + ese ( 1) - eec) = cosa 


aplicando as fórmulas de Euler 


ei? — coso + isen6 е—ї# = coso — iseng 


com 8 = w. Pode-se obter o mesmo resultado também a partir do Problema 3.17(а), 
fazendo Ё = im. 


3.21. Determine a função característica da variável aleatória X cuja função de densi- 
dade é dada por 


12a jej<a 
f) = | 


0 em caso contrário. 


A função característica é dada por 


= Е X f* x 
|| E(geX) = f eitf(x)de = — f gioz dy 
‘i : La ) Za J-a 
1 ег |а _ gieo — gio _ sên qdo 
2a iw |-a Riau au 


aplicando as fórmulas de Euler (v. Problema 3.20) com 0 = qu. 
3.22. Determine a função característica da variável aleatória X cuja função de 
densidade é f(x) = ce-**l, —% < € < o, com a > 0, с uma constante 


conveniente. 


Como f (x) é uma função de densidade, devemos ter 


de modo que 


o = 
UD dy + f e= de | 
© о 
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Então c =4/2. A função característica é, pois, dada por 


Е(еіох) f É estar (a) de 


Top 
sf giézg-at-3) de + f gioxg аба) de | 
0 а 
LS е(а+ш)т de + f ect de | 
| des А 


e- (ix 


a Р 
Sud) Ma) 


COVARIÂNCIA E COEFICIENTE DE CORRELAÇÃO 
3.23. Prove o Teorema 3-14, pág. 116. 


Pela definição de covariância de X e Y, temos 
оху = Cov(X,Y) = EX — ax (Y — ву)] 
E[XY — uxY — uyX + xav) 
E(XY) — 1xE(Y) — uyE(X) + Eluxuy) 
E(XY) — axey — пүнх + Ихйү 
E(XY) — pxuy 
E(XY) — E(X) E(Y) 


3.24. Prove o Teorema 3-15, pág. 117. 


Se X e Y são variáveis independentes, então E(XY) = E(X) E(Y). Assim, 
pelo Problema 3.23, 


ayy = Cov(X,Y) = E(XY)— E(X)E(Y) = 0 
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3.25. Para as variáveis aleatórias X e Y definidas no Problema 2.8, pág. 71, deter- 


(a) 


(b) 


(c) 


(d) 


(e) 


@ 


mine 
(а) E(X), (b) E(Y), (c) E(XY), (d) EX”), (е) EY), 
(f) Var (X), (g) Var (Y), (h) Cov (X, Y), (i) p, 


E(X) = z i sjy) = > x [z fea) ] 


29 
= (ов) + (ido + ez) = 5 = E = 5 
Ev) = E Suit = Зу [Ули ) 
24 кыш 
= (ове) + (е) + (0420 + db) = 7e = E = E 


EY) = > > e fey) 


= (0)(0)(0) + (0)(1)(е) + (0))(2o) + (0)(3)(8е) 
+ @(0)(Фе) + (DUS) + ANo) + (DBE 
+ (8)(0)(4е) + (2)(1)(5е) + (2)(2)(6е) + (2)(8)(7е) 


- 12 n 
10200 = чу = q 


Ex) = E Serem = Zef zren] 


= (0)2(6c) + (D2(14c) + (2)2(220) = 1020 = = = D 
zr? = ZZren = zef 350.0] 

= (02(60) + (1)2(90) + (2)*(120) + (3)2(15c) = 1920 

192 _ 22 

42 7 
29V? 230 
а = Var(X) = EQU)- [EQU]? = E. (2) = 
я Е 55 
2 = Var(Y) = EQ? — (EMP = 2. (2) - 5 
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a» аху = Cov(X,Y) = E(XY) - gung) = H- H) 
= 320. 
= -ia 

> a E 220741 = 790 __ = 20,2108 aprox. 


© P = = 
оху 280/441 \/55/49 у230 V55 


3.26. Faça o Problema 3.25 para as variáveis aleatórias X e Y definidas no Problema 
2.3, pág. 68 


Tomando c=1/210, temos: 


i. p f _ 268 
Ау E a (2s + у) йу = a 
@ (0 = gg fJ, , 9 р = 25 
" y {* f 170 
(0) E) = mm өх һу) баду = => 
m 210 f£. Ly UR Prnt 63 
re 5 8 
(© E(XY) = э P É e (xy)(2% + у) du dy = E 
(d) EG?) = às f. LO. (den +) da dy = 1220 
e Е(Ү) = uf. NU w2 u)dedy = ыз 
= = EX — 2 1220  /268)2 _ 5.036 
и ает иие 63 m = 3.969 
ч A e df a . li75 (170)? _ 16.225 
Gg = Vert) = BU) BO = og — ES) = 7.938 
oxy = Cov(X,Y) = E(XY) — EUO E(Y) 
un . 80 _ /268\/170\ _ _ 200 
CON 63/1163) ^ 3.969 
o = Ha —200/3.969 є —200 
i xoy V/5.036/3.969 V16,225/7.938 ү2.518 y16.225 


= —0,03129 aprox. 


ESPERANÇA, VARIĀNCIA E MOMENTOS CONDICIONAIS 


3.27. Determine a esperança condicional de Y dado X=2 no Problema 2.8, 
pág. 71. 


M 
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Tal como no Probl. 2.27, pág. 85, a função de probabilidade condicional de 
Y dado X 22 é 


fala = fg 


Então, a esperança condicional de Y dado X=2 é 


P е 4c 
E |X=2) 3d $ ) 


onde o somatório cobre todos os valores de y correspondentes a X=2, Vem: 


кт|х=® = oi) +105) + (2) +(5) = E 


3.28. Determine a esperança condicional de (a) Y dado X, e (b) X dado Y, no 
Problema 2.29, pág. 86 


(a) gy|x2e = f wind = fon = 22 
Y. À z 
- Р 
(à) gxiy-o = fj antelmde = SE). 
" E 
21-48) _ Ф1+у+у® 
з) = ғи 


3.29. Determine а variáncia condicional de Y dado X para о Problema 2.29, pág. 
86. 


A variância procurada (momento de ordem 2 em relação à média) é dada por 


EY —-m)2|X=2] = f (y m) foly |а) dy = T" -$) pe 


EN 
18 
onde usamos o fato de que 19 = E(Y | X=x) = 22/8 conforme Probl. 3.28 (a). 


DESIGUALDADE DE TCHEBICHEV 
3.30. Prove a desigualdade de Tchebichev. 


Daremos a demonstração para variáveis contínuas. Para o caso de variáveis 
discretas, basta substituir as integrais por somatórios. Se f (x) é a função de densidade 
de X, então. 


s = em] = f eate 
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Como o integrando é não-negativo, o valor da integral só pode diminuir reduzindo-se o 
intervalo de integração. Assim, 


2 > ls (c—12f() de > Дз». 2х) ах = e NN f(x) de 


Mas a última integral ё P(|X -- «| > е). Logo, 


lo 


P(X-4229 < 5 


E 


3.31. Para as variáveis aleatórias do Problema 3.18, (a) determine Р(| X — 4| > 1). 
(b) Use a desigualdade de Tchebichev para obter uma cota superior de 
P(| X — рі > 1) e compare com o resultado em (a). 
(a) Pelo Problema 3.18, д = 1/2. Então 


E = Bic 3 
x i <1) = e рех) 


pur 
= f Zac*dg = | е8 
E] 


Pal <= »( 


Assim e(|x-3 1) = 1—(-e3) = e? = 0,04979 


(b) Pelo Problema 3.18, c? = д» — н? = 1/4. A desigualdade de Tchebichev 
PiX-4»9 < E 
dá então P(X— 21 < о = 0,25 
Comparando com (a), vemos que a cota fornecida pela desigualdade de Tchebichev 
é assaz grosseira. Na prática, a desigualdade de Tchebichev é utilizada na obtenção 


de estimativas, quando náo é conveniente, ou quando é impossível obter valores 
exatos. 


LEI DOS GRANDES NÚMEROS 


3.32. Prove a Lei dos Grandes Números, Teorema 3-19, pág. 119. 


Temos EX) = EX) = e = Е(Х) = 4 
Var (X,) = Var(X) = = = Var(X,) = o? 
Então 
(Sm Gd FX, 1 ad 
(5) = к( : z ) = (EX) + БЕ] = qo) = а 


Var(S, = Var(X, +: +X,) = Var (Ху) + + + Var (Xp) = no? 


mr 
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de modo que 
ДА 1 2 
Var ler = —qVar(S) = га 


п n 


onde utilizamos o Teorema 3-5 e uma extensão do Teorema 3-7. 
Assim, pela Desigualdade de Tchebichev com X = S,/n. temos 


i 


Passando ao limite quando п > = vem, conforme desejado, 
> ) =0 


OUTRAS MEDIDAS DE TENDÉNCIA CENTRAL 


Sn 
п. E 


da 


Р (| Sa 
lim P rd 


nm 


3.33. A função de densidade de uma variável aleatória contínua Xé 


_ Г42(9 – 22)/81 0& c «8 

fe = to em caso contrário. 

(a) Determine a moda. (b) Determine a mediana. (c) Compare moda, media- 
na e média. 


(а) A moda é o ponto para o qual a densidade de f (x) é máxima. Os máximos relativos 
de f (x) ocorrem nos pontos em que a derivada primeira é zero, i.e., 
а [ 4x(9 — x?) 36 — 1242 


йт| — 8i E 81 = 


Então x = М = 1,73 que é a moda. Note-se que este valor é efetivamente 


máximo, pois a segunda derivada, —242/81, é negativa para х = y3. 
(b) A mediana é o valor a para o qual Р(Х <a) — 1/2. Ora, para 0< a < 3, 
paco = ¿fuera = ¿as 
* Big "e m й\ 4, 


Igualando este resultado a 1/2, obtemos 
2a* — 360º +81 = 0 


donde 


e зо = VB —4Q)81) _ 36+V648 _ y 
2(2) 4 
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Assim, a mediana, que deve estar entre 0 e 3, é dada por 
9 
а = 9-2 


donde а = 1,62 aprox. 


(e) za) = Ef pad = E as DP = 160 
ds пху = ај, = mde = an е сө 


que é praticamente igual à mediana. A fig. 3-6 exibe a moda, a mediana e a média. 


fe) 


Mediana 


3.34, Uma variável aleatória discreta tem função de probabilidade Р(х) = uy 
onde x= 1,2,... . Determine (a) a moda, (b) a mediana e (c) compare-as 
com a média. 


(a) A moda é o valor de x que tem probabilidade máxima. No caso, éx= 1, parao 
qual a probabilidade é 1/2, 


(b) Se x é qualquer valor entre 1 e 2,P(X&x) = 16 Р(Х 1) = j. Assim, qual- 
quer número entre 1 е 2 poderia representar a mediana. Escolhe-se, entáo, por 
conveniéncia, o ponto médio do intervalo, isto ё, 3/2. 


(с) Tal como obtido no Problema 3.3,u= 2. Vê-se assim, que a ordem das três medi- 
das é o inverso da ordem delas no Problema 3.33. 
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PERCENTIS 


3.35. Determine (а) o 10º, (b) o 259 , (c) o 759 percentil da distribuição do 
Problema 3.33. 


Do Problema 3.33(b), temos 


ч _ 4/9% at) _ 1802—41 
PX«d = \27-1) = 8 
(a) О 109 percentil é o valor de a para o qual Р(Х <a) — 0,10, isto é, a solução de 
(18a? — a5)/81 = 0,10. Utilizando o método do Problema 3.33, encontra- 


mos a — 0,68 aprox. 


(b) O 259 percentil é o valor de a tal que (18a? — a*)/81 = 0,25 ; encontramos 
а = 1,098 aprox. 


(c) O 759 percentil é o valor de а tal que (18a? — a)/81 = 0,75 ; encontramos 
a = 2,121 aprox. 


OUTRAS MEDIDAS DE DISPERSÃO 


3.36. Determine (a) o intervalo, (b) o intervalo semi-interquartil e (c) o desvio 
médio da distribuição do Problema 3.33. 


(a) Como todos os valores x > 3 têm probabilidade zero, tomamos como o valor 
máximo, x= 3. Analogamente, como todos os valores x <0 têm probabilidade 
zero, tomamos como valor mínimo x = 0. Então, o intervalo é 3 - 0 = 3. 


(b) Pelo Problema 3.35, o 259 e o 759 percentis são 1,098 e 2,121, respectivamente. 
Assim, 
,121 — 1,098 
Intervalo semi-interquartil — 2121 -1,098 ш 0,51 aprox. 
2 
(c) Pelo Problema 3.33, a média é д = 1,60 = 8/5. Então 


Desvio médio А 
= ом = E(X- = | leal 


ps JE , 
J, «-i de (o — =) e 


Ш 


І 


8/5 fg d К 3 8 da 5 
f, (E. ЭЕТ + f. (e -5 Гао аз |а 


= 0,555 aprox. 
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ASSIMETRIA E ACHATAMENTO 


3.37. Determine (a) o coeficiente de assimetria e (b) o coeficiente de achatamento 
para a distribuição do Problema 3.19. 


Pelo Problema 3.19(5), temos 


a- = 3 . 3693 
25 "s 875 ^1 8750 
(a) Coeficiente de assimetria = «y = 5 = —0,1253 
Ha 


(b) Coeficiente de achatamento = «y = P ia 2,172 


Verifica-se moderada assimetria à esquerda (v. Fig. 3-6). Outrossim, a distribuição 
é um pouco mais achatada do que a distribuição normal, que acusa achatamento 


(kurtosis) igual a 3. 


PROBLEMAS DIVERSOS 


3.38. Se M (t) é a função geratriz de momentos para uma variável aleatória X, prove 
que a média é и = M'(0) e a variância é о? = M"'(0) — [M"(0)]?. 


De (32), pág. 113, temos, fazendor =1 e r=2, 


№ = М'(0) u = M"(0) 
Então, de (27) 
à = M0) ш = аё = M”(0) — [M'(0)]* 


3.39. Seja X uma variável aleatória que toma os valores х, = k com probabilidades 
pe k=+1,..., =n. (a) Determine a função característica p(w) de X 
е (b) obtenha pr em termos de (o). 


(a) A função característica é 
a л 
glo) = E(eeX) = Ж conp, = X реко 
k——n k-—m 
(b) Multipliquemos ambos os membros de (а) por e ^ e integremos em relação a wW 
de 0 a 27. Entáo И 


27 RS 
f e~o pl) de = X ж f elt-Doda = 2rp; 
Ju=0 к-а яя 
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ви | ple Pr ej 
pois f cidade = + Xk—3) lo ? 
Jaza | Do kj 
17 4 s 
Assim, Bj "ox | e io p(w) de 
27 Jo=0 


ou substituindo j por К, 


1 Г?” 
= + f £7 1&9 p(w) dis 
27 Zoo 


n 
Costuma-se chamar $ pyeito (onde m pode ser, teoricamente, infinito) a 
k——n 


Pk 


série de Fourier de qlo) e py os coeficientes de Fourier. No caso de variável 
contínua, a série de Fourier é substituída pela integral de Fourier. (v. pág. 115). 


3.40. Use o Problema 3.39 para obter a distribuição de probabilidade de uma 
variável aleatória cuja função característica é p(o) = cos o. 


а, 
Do Problema 3.39, 


1 г” 
w = > е ко cog o du 
27 Duo 


ji fr А pe vg zi 
0 EE 
2л f те 2 дь 


1 (7 1 С” 
Í gi Do do + — ei tOu do 
4r Jo 47 Ja-o 


lu 


Se k= 1, obtemos ру = 4; Se k= —1, obtemos p—; = j. Para todos os outros 
valores de k, é pj, = 0. 
Assim, a variável aleatória é dada por 


1 probabilidade 1/ 
X= 
= 1 probabilidade 1/2 
A título de verificação, cf. Problema 3.20. 


3.41. Determine (a) o coeficiente de assimetria e (b) o coeficiente de achatamento 
da distribuição definida pela curva normal, cuja densidade ё 


1 Р 
= ga? zas 
f(x) T vc cg 
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(a) A distribuição tem a apariéncia da Fig. 3-7. Por simetria, ш =4=0 € из = 0. 
Assim, o coeficiente de assimetria é zero. 


1) 


(b) Temos 


n 


é = EM?) 


onde fizemos a transformação «2/2 — v e utilizamos propriedades da função ga- 
ma dadas em (2) e (5) do Apéndice A. Analogamente, obtemos 


{ ж E) = z f. pie TP de 2 S eea 
gd om BS === х b > Ss | 4 
` Vêm os у ~o 
zx E f “du 
Ут do 
\ 
ы E B a ъа) - 3 
vs \® yr 2212 
Ora, 
é = EX] = ЕО) = d = 1 


= E(X-,M]- EX) = ш = 3 


т = 


Assim, o coeficiente de achatamento E e o 
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342. Prove que —1 <p < 1 (v. pág. 117). 


Para qualquer constante c real, temos 
E((Y — ay — (A ах) > 0 
Ora, o membro esquerdo pode ser descrito 
E((Y — y] + CEUX — ux? — 2eE(X — (Y — ну)] 


c 
z0 о 26 1 


XY хү ER 


9202 Wa 


о que equivale a; o? &1 ou —1 <p<l. 


Problemas Suplementares 


ESPERANCA DE VARIÁVEIS ALEATÓRIAS 


— 2 com probab. 1/3 
3.43. Uma v.a. X é definida por X= 3 com probab. 1/2 
1 com probab. 1/6 


Calcule (a) E(X), (b) E(X + 5), (c) E(X3). 


3.44. Uma v.a. X tem fungáo de densidade dada por 
| раё 0<=<1 
f(x) = 


| 0 em caso contrário. 


Calcule (a) E(X), (b) EBX—2), (с) E(X?). 


3.45. 


346. 


347. 


3.48. 


3.49. 


3.50. 


351. 


352. 
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A função de densidade de uma v.a. X é 


jt s f. x20 


0 em caso contrário 


Calcule (a) E(X), (b) E(X2), (c) E((X — 192]. 


Qual o númeto esperado de pontos em trés jogadas sucessivas de um dado? Sua resposta 
parece razoável? Explique. 


Uma v.a. X tem fungáo de densidade 


ec? 0 
Ru = li x<0 


Calcule E(e?x/3), 


Sejam X е Y variáveis aleatórias independentes, cada uma com função de densidade 


o аа uzo 


0 ет caso contrário 


Јо) 


Calcule (а) E(X +Y), (b) Е(Х2 + ҮЗ), (c) E(XY). 


Ё (а) E(X +Y) = E(X) + EM), (b) E(XY) = E(X) EO) 
no Probi. 3.48? Explique. 


Sejam X e Y variáveis aleatórias com função de densidade conjunta dada por 


я Bale +y) 0<2<1, 05y <2 
Hay) = 


em caso contrário 


o 


Calcule (a) E(X), (b) E(Y), (e) E(X + Y), (d) E(XY). 


É (a) E(X- Y) =E(2)+E(Y), (0) E(XY) = E(X) E(Y), 
no Probl, 3.50? Explique. 
Sejam X e Y varidveis aleatórias com densidade conjunta dada por 


Гау 0<х<1, 0<у<1 
Hay) = lo 


em caso contrário 


Calcule (a) E(X), (b) E(Y), (e) Е(Х + Ү), (d) E(XY). 
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3.53. Е (a) E(X +Y) = E(X) + E(Y), (b) E(XY) = E(X) E(Y), 

no Probl. 3.52? Explique. 

[agen 0< 1 <1, 0&y«2 
em caso contrário 


3-54. Seja fe» = jo 


Calcule (а) E(X), (b) E(Y), (0) E(X?), (d) E(Y?), (е) E(X +Y), (f) EY). 


3.55. Sejam X e Y variáveis aleatórias independentes tais que 
1 prob. 1/3 f 2 prob. 3/4 
X= Fo q 
0 prob. 2/3 l-3 prob. 1/4 


Calcule (a) E(3X+2Y), (b) E(2X2—Y3), (с) E(XY), (d) ECOY). 


n variáveis aleatórias identicamente distribuídas, tais que 


3.56. Sejam Xy, Xo,..., X, 
[ 1 prob. 1/2 
X, = 4 2  prob.1/3 
| =1 prob. 1/6 
Calcule (o) E(X, + Xy Xn) (0) BORA XE HAD 


VARIÂNCIA E DESVIO PADRÃO 


3.57. Determine (a) a variância, (b) o desvio padrão do número de pontos que podem aparecer 


em uma jogada de um dado. 


3.58. Seja X uma v.a. com função de densidade 
—2X 2&2 


f 1/4 
em caso contrário 


{шй = Lo 


Calcule (a) Var (X), (b) ex. 


(et 220 


em caso contrário 


3.59. Seja X uma v.a. com função de densidade 
He) = 


Calcule (а) Var (X), (b) ox. 
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. Determine a variância e o desvio padrão da variável aleatória X (a) do Probl. 3.43, 
(b) do Probl. 3.44. 


3.61. Uma variável aleatória Y tem E(X) — 2, E(X?) = 8. 
Calcule (a) Var(X), (b) ох. 


3.62. Se uma v.a. Xétalque Е[(Х — 1) = 10, E((X—2?] = 6 
Calcule (a) E(X), (b) Var (X),(c) оу. 


3.63. Prove o Teorema 3-1 pág. 109. 


MOMENTOS E FUNÇÕES GERATRIZES DE MOMENTOS 


3.64. Determine (a) a função geratriz de momentos de variável aleatória 


f 1/2  prob.1/2 
Mo 4 
[-1/2 prob. 1/2 


e (b) os quatro primeiros momentos em relação à origem. 
3.65. (a) Determine a função geratriz de momentos de uma v.a. X cuja função de densidade é 


(2/2 0<x*<2 


0 em caso contrário. 


Ha) 


(b) Use a função geratriz de momentos da primeira parte para determinar os quatro 
primeiros momentos em relação à origem. 


3.66. Ache os quatro primeiros momentos em relação à média (a) no Problema 3.43, (b) no 
Problema 3.44, 


3.67. (a) Determine a função geratriz de momentos de uma v.a. X com função de densidade 


[e zx 20 
fe = 3 


| 0 em caso contrário. 
(b) determine os quatro primeiros momentos em relação à origem. 
3.68, No Problema 3.67, determine os quatro primeiros momentos em relação à media. 


3.69. Seja X uma v.a, com função de densidade 


[1d —a) a<<b 
1@) = 10 


em caso contrário 
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Determine o momento de ordem k (a) em relação à origem, (b) em relação a média. 


3.70. Se М (t) é a função geratriz de momentos da v.a. X , mostre que os 30 e 40 momentos 
em relação à média são dados por 
us = М'”(0) — 3M” (0) M'(0) + 2[M'(0)]2 


a, = MO) — 4M”"(0) M'(0) + 6M"(0)[M'(0)]? — 3[M'(0)]* 
FUNÇÕES CARACTERISTICAS 


3.71. Prove o Teorema 3-11, pág. 115. 
& prob. p 


3.72. Determine a função característica dava. X = 
b prob т=1—р 


3.73. Determine a função característica de uma v.a. X com função de densidade 


12а |2 5а 
fa = { 


O em caso contrário. 


3,74. Determine a função característica de uma v.a. X com função de densidade 


2/2 05252 
fx) = z 
0 em caso contrário. 
1 prob. 1/2 
3.75. Sejam X, = ЕГ variáveis aleatórias independentes (k = 1,2, ...,%). 


Prove que a função característica da variável aleatória 
XQ Ху+ +X, 


vn 
é [eos (o/ V )]"- 


3.76. Prove que, quando n > ^ , a função característica do Problema 3.75 tende para e-9/2, 
(Sugestão: Tome o log da função característica e aplique a regra de L'Hospital). 


COVARIÁNCIA E COEFICIENTE DE CORRELACÁO 


3.77. Sejam X e Y variáveis aleatórias com função de densidade conjunta dada por 


| fatu 0, 0Xy<1 
fem = 1, em caso contrário. 


Calcule (a) Var(X), (b) Var (Y), (c) ex, (d) oy. (е) oxy, (f) e- 


3.78. 


3.79. 


3.80. 


3.81. 


3.82. 
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Faça o Probl. 3.77 se a função de densidade conjunta é 
ета+ә0 220, 420 
Hey) = 


0 — em caso contrário. 


Calcule (а) Var (Х), (b) Var Y, (с) ex, (d) oy, (е) oxy, (f) p, рага as variáveis 
do Problema 2.57. 


Faça o Problema 3.79 para as variáveis aleatórias do Problema 2.99, 


Calcule (a) a covariáncia e (b) o coeficiente de correlação de duas variáveis aleatórias 
XeYse E(X) = 2, E(Y) = 3, E(XY) = 10, E(X?) = 9, E(Y?) = 16. 


O coeficiente de correlação de duas variáveis aleatórias X e Y —1 e suas variáncias sáo 
3 e 5. Determine a covariáncia. 


ESPERANÇA, COVARIÁNCIA E MOMENTOS CONDICIONAIS 


3.83. 


3.84, 


3.85. 


3.86. 


3.87. 


3.88. 


Sejam X e Y com função de densidade conjunta 


Қа, v) 


0 em caso contrário. 


5 ty 0€z&À1i, 0< y Sl 


Determine a esperança condicional de (a) Y dado X, (b) X dado Y. 


Faça o Problema 3.83 se 


ze +27) x20,y20 
ху = 


em caso contrário, 


Sejam X e Y com a função de probabilidade conjunta dada па Tábua 2-9, pág. 103, 
Determine a esperança condicional de (a) Y dado X, (b) X dado E 


Se X e Y são variáveis aleatórias indopendentes contínuas, prove que as densidades 
condicionais de X dado Y e de Y dado X sáo as mesmas, respectivamente, que as den- 
sidades marginais de X e Y. 


Enuncie e prove, para variáveis aleatórias discretas, um resultado anáiogu ao do Problema 
3.86. 


Ilustre, por meio de um exemplo, o resultado (a) do Problema 3.86, (b) do Problema 
3.87. 
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3.89. Determine a variância condicional de (a) Y dado X, (b) X dado Y, para a distribuição 
do Problema 3.83. 

3.90. Faça o Problema 3.89 para a distribuição do Problema 3.84 


3.91, Faça o Problema 3.89 para a distribuição do Problema 2.99. 


DESIGUALDADE DE TCHEBICHEV 


3.92. Uma v.a. X tem média 3 e variância 2. Use a desigualdade de Tchebichev para obter uma 
cota superior para (a) P(|X —3| >/2), (b) P(X —3| 2 1). 


3.93. Prove a desigualdade de Tchebichev' para uma variável discreta X. (Sugestão: cf. Proble- 
ma 3.30). 


3.94. Uma v.a. X tem uma função de densidade f(x) = е 181, —= < а < «=. (a) Calcule 
P(X — | > 2). (b) Use a desigualdade de Tchebichev para obter uma cota superior 
para P(|X —u| > 2) е compare com o resultado de (a). 


3.95. Sejam X;,Xs, ..., X, п variáveis aleatórias independentes cada uma com função de 
densidade dada por 


[i2 -1<x<1 


i 0 em caso contrário. 


Ја) = 


S. 


Se Sp =X; +X, t- +X, mostreque rl >.) < ze 
"ne 


LEI DOS GRANDES NÜMEROS 


3.96. Mostre que a lei (fraca) dos grandes nümeros pode expressar-se como 
DEN 


n variáveis aleatórias independentes tais que 


Interprete. 


3.97. Sejam Xy (k — 
1 b. 
X, = Ji prob. p 
|o prob. q—1-p 


(a) Se interpretarmos Ху como o número de "caras" na k^ jogada de uma moeda, que 
три k 
interpretação poderemos dara Sn = Xit c: X4? 


(b) Mostre que, neste caso, a lei dos grandes números se reduz a 


lim *( >.) = 0 


e interprete este resultado. 


Sn 
a P 
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3.98. Sejam Xy, k=1,2,.-., variáveis aleatórias independentes cada uma com funcio 
de densidade dada por 
1 
Ha) + << 


Mostre que a lei dos grandes números náo se aplica a este caso. 


3.99. (a) A lei dos grandes números seria válida se a fungáo de densidade do Problema 3.98 
fosse substituída рог f(x) = e/(1 + at)? 


(Б) É preciso que existam todos os momentos de uma distribuição para que a lei dos 
ição para 4 
grandes números seja válida? Justifique suas respostas. 


OUTRAS MEDIDAS DE TENDÊNCIA CENTRAL 


3.100. Determine (а) a moda e (b) a mediana de uma v.a. X cuja função de densidade é 
f e 2420 
Ја) = 


L 0 em caso contrário. 
e (c) compare com a média. 


3.101. Faça o Problema 3.100 para a função de densidade 
401—2) 0«х<1 
қ) = lo 


em caso contrário. 
3.102, Determine (a) a mediana e (b) a moda de uma v.a. X definida por 
e [ 2 prob. 1/3 


“dm ET 
e compare com a média. \ pros: 2/8 


3.103. Determine (a) a mediana e (b) a moda do conjunto de números 1, 3, 2, 1, 5, 6, 3, 3e 
compare com a média. 


PERCENTIS 


3.104. Determine (а) o 259 e (b) o 759 percentil da v.a. cuja função de densidade é 
i=) 0<*<1 


0 em caso contrário, 


fe = 4 


3.105. Determine (a) а 109, (b) о 259, (c) o 759, (d) o 909: percentil para uma v.a. cuja função 
de densidade é 


ezi 


[ cx — 23) 


fa) = 
fe 1 0 em caso contrário. 


onde c é uma constante apropriada. 


== 
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3.106. Uma v.a. X tem função de densidade dada por 


pem >0 
red A 


1 0. em caso contrário. 
Prove que o porcentil de ordem 100p tem o valor —In (1 — р) onde 0< p < 1. 


3.107. Uma v.a. X tem função de densidade f(x) = 1/w(1 +42), —e«m-«e. Prove que 
o percentil de ordem 100p tem o valor tan (p—3» onde0< p «d. 


OUTRAS MEDIDAS DE DISPERSÃO 


3.108. Determine (a) o intervalo, (b) o intervalo semi-interquartil e (c) o desvio médio da v.a. do 
Problema 3.104. 


3.109. Faça o Problema 3.108 para a variável aleatória do Problema 3.105. 


3.110. Explique por que o intervalo não é uma medida adequada de dispersão no caso (a) do 
Problema 3.106, (b) do Problema 3.107. 


3.111. Prove que o intervalo semi-interquartil para a v.a. do Problema 3.106 é ln, 
3.112. Prove que o intervalo semi-interquartil para a v.a. do Problema 3.107 1. 
3.113. Determine о desvio médio da v.a. X (a) do Probl. 3.106, (b) do Probl. 3.107. 


3.114. Obtenha a probabilidade de uma v.a. X diferir de sua média por mais de um intervalo 
semi-interquartil no caso (а) do Probl. 3.104, (b) do Probl. 3.106. 


ASSIMETRIA E ACHATAMENTO 


" fea =a?) -1< 1 S1' 
3.115, Seja f(x) = + , sendo c uma constante apropriada, a função 
lo em caso contrário 
de densidade de uma variável aleatória X. Determine (a) o coeficiente de assimetria, (b) o 
coeficiente de achatamento. 


3.116. Determine (a) coeficiente de assimetria, (b) coeficiente de achatamento para а distribui- 
ção do Problema 3.106. 


3.117. Pode-se definir um coeficiente de achatamento para a distribuição do Problema 3.107? 
Justifique sua resposta. 


3.118.Se (2-8) la <a 
fe = ш 


0 lx] > a 
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onde c é uma constante adequada, é a função de densidade de X, determine (a) o cocfi- 
ciente de assimetria, (b) o coeficiente de achatamento. 


3.119. Determine os coeficientes (a) de assimetria, (b) de achatamento, para a distribuição cuja 
função de densidade é 


fre «20 
inn Lo z«0 


PROBLEMAS DIVERSOS 


3.120.Seja X uma v.a. que pode tomar os valores 2, 1 e 3 com probabilidades 1/3, 1/6 e 1/2, 
respectivamente. Determine (а) a média, (Б) a variância, (c) a função geratriz de momen- 
tos, (d) a função característica, (e) o terceiro momento em relação à média. 


3.121. Faça o Problema 3.120 se X tem função de densidade 


[60 = а) 0<x<1 
Ha) = + em 

| 0 em caso contrário. 
onde c é uma constante apropriada. 


3.122. Jogam-se sucessivamente trés dados. Determine (a) a média e (b) a variáncia da soma dos 
pontos. 


3.123. Seja X uma v.a. com função de densidade 
fœ 9 <х<2 


Peu = + EA 

[0 em caso contrário. 

onde c é uma constante apropriada. Determine (a) a média, (b) a variância, (c) a função 
geratriz de momentos, (d) a função característica, (e) o coeficiente de assimetria, (f) о 
coeficiente de achatamento. 


3.124.Com relação ao Problema 1.156, pág. 50, determine o número esperado de cartas que 
chegarão ao seu destino. 


3.125. Sejam X e Y variáveis com função de densidade conjunta 


fem 0<e<1, 0<y<1 


Hey) = lo 


em caso contrário. 


Determine (a) E(X?-- ҮЗ), (b) E(V X* - У?). 


3.126.Faça o Problema 3.125 se X c Y são variáveis aleatórias indcpendentes identicamente 
distribuídas com funcio de densidade Flu) = (27) ie 802, o <и < а, 
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3.127. Seja X uma v.a. com função de densidade 
[ 1 =1<5:<1 


№) = 1 0 ет caso contrário. 


eseja Y — X% Determine (a) E(X), (b) E(Y), (e) E(XY). 


3.128, Use o resultado do Problema 3.127 para mostrar que podemos ter Б(ХҮ) = E(X) E(Y) 
sem que X e Y sejam independentes. 


3.129. Prove que, se X e Y são variáveis alcatórias independentes, entáo EX) a = 
= HX): Elg(Y)] onde f (X) e £ (Y) são funções dessas variáveis. Há restrições 
quanto a essas funções? Explique. 


3.130.Sc X e Y são variáveis aleatórias com função de densidade conjunta f (x, y), a função 
geratriz de momentos de X e Y é definida como 


Mita) = E[e*'"w] = f. f£ giz twi f(x, y) de dy 


(a) Determine a fungáo geratriz de momentos da distribuição do Probl. 3.125. 


(b) A função geratriz de momentos de X e Y, neste caso, é igual ao produto da função 
geratriz de momentos X pela função geratriz de Y? Explique sua resposta, e diga se 
é válida para todas as funções de densidade conjunta f (x, y). 


3.131.Mostre como utilizar a função geratriz de momentos do Problema 3.130 para calcular 
Е(Хтүп) com т e n intervalos inteiros positivos. 


3.132. À vista do Problema 3.130, como definiria a função característica de X c Y ? Ilustre com 
um exemplo. 


3.133, Um jogo consiste em jogar uma moeda até aparecer “cara”, Se isso ocorrer na ge 
jogada, o jogador receberá 2k dólares. Supondo а moeda “honesta”, determine a esperan- 
ça do jogador, e discuta a significância de sua resposta. (Este jogo é comumente conheci- 
do como o paradoxo de S. Petersburgo). 


3.134. Faça o Problema 3.133 no caso de uma moeda viciada. 


3.135, Prove que se Xy, ..., X, sio variáveis aleatórias quaisquer, então 


( 


Уа 


р ) = 5 Var(X) + E Cort) 
=t / k=1 Pek 
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3.136.Seja M (t) a função geratriz de momentos de uma variável aleatória X. Prove que se 
K(t) =InM(t) então (a) K'(0) = u = E(X), (b) K"(0) = о? = Var (X). 


3.137. Referindo-se 20 Problema 3.136, expresse (a) o 3º e (b) o 4º momento em termos de K 
e suas derivações calculadas em t = 0. 


3.138. Obtenha resultados correspondentes aos Problemas 3.136 e 3.137 para a função carac- 
terística. 


3.139. Sejam X;, Xə ..., X, variáveis aleatórias independentes identicamente distribuídas, 
com função de densidade 


. "ia [e <a 
fe = | 


O em caso contrário. 


onde а > 0. Determine a função característica de 
XQ XQ X, 
vn 
3.140. (a) Prove que, quando n = a função característica do Problema 3.139 tende para 


eu, Compare com os Problemas 3.75 e 3.76. (b) Que conclusões podemos 
tirar quanto às distribuições limites nos dois casos? 


E к» + 


capítulo 4 


Distribuicóes Especiais de Probabilidade 


^A DISTRIBUIÇÃO BINOMIAL 
(ou DISTRIBUIÇÃO DE BERNOULLI) 


Suponhamos um experimento tal como a jogada repetida de uma moeda, ou a 
escolha de repetidas fichas de uma urna, еіс Cada jogada ou extração é chamada 
uma prova. Em cada prova em particular há uma probabilidade associada a um 
determinado evento, tal como aparecimento de “сага” na moeda, a escolha de uma 
ficha vermelha, etc." Em certos experimentos, a probabilidade não varia de prova 
para prova (tal como no caso da jogada de uma moeda, ou de um dado). Tais pro- 
vas dizem-se então independentes e costumam designar-se como provas de Bemoulli, 
em honra a James Bernoulli, que primeiro as estudou no fim do século XVIL 

Seja p a probabilidade de ocorrência de um evento em uma prova de Ker- 
пош (chamada probabilidade de sucesso). Entãog=1 — pé a probabilidade de 
não-ocorrência do evento (chamada probabilidade ie falha). A probabilidade de o 
evento ocorrer exatamente x vezes em п provas (isto é, da ocorrência de x :cessos 


en — x falhas) é dada pela função de probabilidade 


т. T 
E aq P (1) 


to = Р(Х=а) = (rem = 


onde a variável aleatória X denota o número de sucessos em n provas, e 


LED, Le us um 


| 
| 
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EXEMPLO 4.1. A probabilidade de obter exatamente 2 “caras” em 6 jogadas de uma moeda é 


O (ava? 25 
RSS OE E OO) CO 


A função de probabilidade discreta (1) é designada como distribuição bino- 
mial, porque para x = 0, 1,2, ... , п, corresponde aos termos sucessivos do desen- 


volvimento binomial x 
n à 

e» ne lr (Per 

5 n күн —х 

à Gra e 
Chama-se também distribuição de Bernoulli, Uma variável aleatória que tenha a 
distribuição (1) diz-se distribuída segundo Bernoulli, ou distribuída binomialmente. 
ALGUMAS PROPRIEDADES DA DISTRIBUIÇÃO BINOMIAL 


A seguir relacionamos algumas das importantes propriedades da distribuição 
binomial 


Tabua 4-1 


Média 


Variância 


Desvio padrão 


Coeficiente de assimetria 


Coeficiente de achatamento 


Função geratriz de momentos M(t) = (q+ pe" 


Função característica (а + реіч)" 


DISTRIBUICOES ESPECIAIS DE PROBABILIDADE 157 


EXEMPLO 4.2. Em 100 jogadas de uma moeda, o número esperado de “caras” é 
п = (100)( 


enquanto que o desvio padrão é o = V/(100)(3)(4) = 5. 


A LEI DOS GRANDES NÚMEROS NO CASO DAS PROVAS DE 
BERNOULLI 


A lei dos grandes números (pág. 119) admite uma interessante interpretação 
no caso das provas de Bernoulli, consubstanciada no seguinte teorema. 


Teorema 4-1 (Lei dos Grandes Números Para Provas de Bernoulli): Seja X a v.a. que 
dá o número de sucessos em п provas de Bernoulli, de modo que X/n 
é a proporção de sucessos. Então, se p é a probabilidade de sucesso e 
e é um número positivo arbitrário, 


tim P(|ž -p| > «) = (3) 


neo 


Em outras palavras: em uma sequência assaz longa de provas torna-se extre- 
mamente provável que a proporção de sucessos X/n esteja arbitrariamente próxima 
da probabilidade de sucesso em uma prova, p. Esta lei justifica, em certo sentido, 
a utilização da definição empírica de probabilidade dada à pág. 8. Resultado mais 
forte é proporcionado pela lei forte dos grandes números (página 120), que afirma 
que lim X/n = Р, com probabilidade 1, isto é, X/n converge efetivamente para p 
exceto ém um número desprezível de casos. 


A DISTRIBUIÇÃO NORMAL 


Um dos mais importantes exemplos de distribuição contínua de probabilidade 
é a distribuição normal, às vezes chamada distribuição gaussiana. A função de den- 
sidade para esta distribuição é dada por 


Қа) = есеи оао (4) 


oy 2r 
onde и e о são, respectivamente, a média e o desvio padrão. A função de distribuição 
correspondente é 


1 du 2/39? 
#( = P(X&x) = 01/20? q, 5 
9 | ) oy 2r L, И sm 6) 
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Diz-se então que a variável aleatória X é distribuída normalmente com média ре 
variância o”. 
Se Z é a variável padronizada correspondente a X, isto é, se 


Z es HE (6) 

с 
então а média ou valor esperado de Z é zero e a variância é 1. Em tal caso, a função 
de densidade de Z pode ser obtida de (4) fazendo-se formalmente p = 0 ео= 1, 


donde 


fa) = l ge (7) 


y 27 


Esta função é comumente designada função ou distribuição de densidade normal 
padronizada. A função de distribuição correspondente é dada por 


1 ^ 2, 1 1, ® euh х 
F(z) = Р(2<2) = f edu = y — À e? du (8) 
Vr V-o 2 vd 
Às vezes costuma-se chamar o valor z da variável padronizada Z, “escore” pa- 
dronizado. A função F(z) está relacionada diretamente com a função erro, erf(z), 
extensamente tabelada. Temos 


erf (2) = sel ec" du е F(z) = E + et (5) | (9) 


T 


A Fig. 4-1 exibe o gráfico da fungáo de densidade (7), por vezes chamado 
curva normal padronizada. Nesse gráfico indicamos as áreas 1, 2 e 3 desvios padrões 


-3 -2 = 1 2 3 
«—— 68,27% — 
E 95,4596 > 
= 99,73% > 
Fig. 4-1 


—————— 
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a contar da média, (isto é, entre Z =— 1e 1,2-—2e2,z-— 3 e 3, iguais, 
respectivamente, a 68,27%, 95,45% e 99,73% da área total, que é um. Signi- 
fica isto que 


P(-1<Z<1) = 0,6827, P(-2<Z2<2) = 0,9545, 
P(-3<2<83) = 0,973 (10) 


O Apéndice C dá uma tabela contendo as áreas sob esta curva, limitadas pelas 
ordenadas em 2 = 0 e um qualquer valor positivo de 2. Por essa tabela, podemos 
determinar a área entre duas ordenadas quaisquer, valendo-nos da simetria da curva 
em relação a z = 0. 


ALGUMAS PROPRIEDADES DA DISTRIBUIÇÃO NORMAL 


A Tábua a seguir dá algumas das importantes propriedades da distribuição 
normal geral. 


Tábua 4-2 


Média 


Variância 


Desvio padrão 


Coeficiente de Assimetria 


Coeficiente de Kurtosis 


Ауру, 


Função Geratriz de Momentos M(t) = ento 


ipo — (Coto? r2) 


Função Característica gla) = e 


RELACÁO ENTRE AS DISTRIBUICOES BINOMIAL E NORMAL 
Se n é grande e nem p nem q sáo demasiadamente próximos de zero, a dis- 


tribuição binomial pode ser satisfatoriamente aproximada por uma distribuição 
normal com variável aleatória padronizada, dada por: 


(11) 


=e ma n 


) 
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Aqui X é a v.a. que dá o número de sucessos em п provas de Bernoulli e p é a 
probabilidade de sucesso. A aproximação melhora com O crescer de ne é exata no 
caso limite (v. Problema 4.17). Na prática, a aproximação é muito boa, se np e rq 
são ambos maiores que 5. Pode-se descrever o fato de a distribuição binomial. 
tender para a distribuição normal, escrevendo 


. X-np 1 LN 
tim P(« «E Les) = $ ё? di 12 
no үйр ` vêr Ја ©; 


Em palavras, a variável aleatória padronizada (X—np)wympq é assintotica- 
mente normal. 


« A DISTRIBUIÇÃO DE POISSON 


Seja X uma v.a. discreta que pode tomar os valores 0, 1, 2, 3, ... , e cuja fun- 
ção de probabilidade é dada por 
Was 


fa) = Р(Х= х) = El OA а (13) 


onde À é uma constante positiva dada. Tal distribuição é chamada distribuição de 
Poisson (S.D. Poisson, que a descobriu e estudou na primeira parte do século XIX); 
uma variável aleatória que tenha essa distribuição é distribuída segundo Poisson. 

Os valores de f(x) em (13) podem ser obtidos utilizando-se o Apéndice H, 


que dá е^ para diversos valores de A, ou empregando logaritmos. 


ALGUMAS PROPRIEDADES DA DISTRIBUIÇÃO DE POISSON 


Eis algumas propriedades importantes da distribuição de Poisson: 


Tábua 4-3 
Média p= А 
Variáncia о? = А 
_ Desvio padrão o = VA 
Coeficiente de Assimetria вз = I/V% 
Coeficiente de Kurtosis а =3+(/N, | 
_ А M) = MD 
ds Função Geratriz de Momentos 
Função Característica FEE ui 
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RELAÇÃO ENTRE AS DISTRIBUIÇÕES BINOMIAL E DE POISSON 


Na distribuição binomial (1), se n é grande, mas a probabilidade de p de 
ocorrência de um evento é vizinha de zero, de modo que q = 1 — p, é próximo de 1, 
o evento se diz um evento raro. Na prática consideraremos como raro um evento se 
o número de provas é no mínimo 50 e np é menor do que 5. Em tais casos, a distri- 
buição binomial é muito bem aproximada pela distribuição de Poisson (13) com 
Л = пр. Tal resultado já era de esperar-se, pois, fazendo А = np, д = 1ep= 0 па 
Tábua 4-1 obtemos os valores da Tábua 4-3. 


RELAÇÃO ENTRE AS DISTRIBUIÇÕES DE POISSON E NORMAL 


Como existe uma relação entre as distribuições binomial e normal, e entre a 
binomial e a de Poisson, é de esperar-se que exista uma relação entre as distribuições 
normal e de Poisson. E este é o caso, efetivamente. Pode-se mostrar que se X é a 
variável de Poisson de (13) e (X — A)/VÀ é a correspondente variável aleatória 
padronizada, então 


X-A 1 Da 
tim P(a < = <b) = y g ga 14 
ite /А ут “a a 


isto é, a distribuição de Poisson tende para a distribuição normal quando A+ со 
ou seja, (X —A)//A é assintoticamente normal. 


O TEOREMA DO LIMITE CENTRAL 


A semelhança entre (12) e (14) naturalmente nos leva a perguntar se não 
haverá outras distribuições, além da binomial e da de Poisson, que tenham a distri- 
buição normal como caso limite. O teorema seguinte deixa claro que existe efetiva- 
mente uma ampla classe de distribuições com essa propriedade. 


Teorema 4-2 (Teorema do Limite Central): SejamX,, Xo,.. variáveis aleatórias 
independentes, identicamente distribuídas (i.e., todas têm a mesma 
função de probabilidade no caso discreto ou a mesma função de densi- 
dade no caso contínuo) e com média и e variância o? finitas, Então 
se 


Bo RR ELE Д) 


5, 1 + 
lim P(a «9 <) = L (eva 
2m uw Ww e. 


тт 
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isto é, a variável aleatória (Sn — nj) evt, que é a variável padroni- 
zada correspondente a Spn, é assintoticamente normal. 
O teorema é válido também sob condições mais gerais, por exemplo, quando 
Ху, Xa, ... , São variáveis aleatórias independentes com a mesma média e a mesma 
variância, mas não necessariamente com a mesma distribuição. 


A DISTRIBUIÇÃO MULTINOMIAL 


Suponhamos que os eventos 4 |, А), «<<» А р possam ocorrer com probabilidades 
Py Po = Р COM ру + рә +... +p, = 1. Se Xp X, s X, sáo as variáveis aleató- 
rias que dão, respectivamente, os números de vezes que A y, A», ++ Ар ocorrem em 
n provas, de modo que X tXQ,t.otX,-n entáo + 


| 
Р(Х, = ni, Xa ns, ..., Хк= к) xn IU (16) 
onde nı + +++: += n, é a função de probabilidade conjunta para as 
variáveis aleatórias Xi, ..., Хк. 
Esta distribuição, que é uma generalização da distribuição binomial, é chama- 
da distribuição multinomial, pois (16) é o termo geral do desenvolvimento multi- 
nomial de (Pı + pz + -=° + pu)". 


EXEMPLO 4.3. Jogando-se um dado 12 vezes, a probabilidade de obter exatamente 2 vezes 


cada um dos pontos 1, 2,3,4,5 e6 é 2 à T " 
PU Se Xni. p = dê. iV yay avayay 
pow qn ees a 212121212121(6/ \6/ (6/ \6/ V6/ V6 


1925 _ 
— 559.872 — 00088 
Os números esperados de vezes que Ai, Аз,..., Ar ocorrem em n provas 
são NP1, Тр», ..., NPr respectivamente, isto é, 
E(Xj = пр,  E(Xi) = тр, .... E(Xi) = nm (17) 


N A DISTRIBUICAO HIPERGEOMÉTRICA 


Suponha-se uma caixa com b bolas azuis e r vermelhas. Façamos n provas 
consistindo cada uma em extrair uma bola aleatoriamente, anotar sua cor, e resti- 
tuíla à caixa. Experimentos deste tipo são em geral conhecidos como amostragem 
com reposição. Então, se X é a v.a. que dá o número de bolas azuis escolhidas 
(sucessos) em n provas, utilizando a distribuição binomial (1) vemos que a proba- 
bilidade de exatamente x sucessos é nuu 

P(X=a) = Mas (18) 


pois р = b/(b +r), 0=1-р = ri(b + T). 


g 
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Se a amostragem for sem reposição, isto é, se as bolas não forem restituídas 
à caixa após cada extração, então 


lla" a 

PX=x) = SES М шу 19 

( ) ( P ES (19) 
n 

Trata-se de uma distribuido hipergeométrica, cujas média e variância são 


mb nbr(b+r—n) 
AM ES © {Б+ту(Б+т—1) 
Se N é o número total de bolas azuis e vermelhas, sendo p e q = 1 — p, respec- 
tivamente, as proporções de azuis e vermelhas, então 


o (20) 


bob TL ow b=Np т = № (21) 


bor ON 1= br N 


de modo que (19) e (20) se tornam, respectivamente, 


Ni Nq 
RT К 


Р(Х ==) = I 
n ) 
(N-n 
p = np o = "ФУ w (28) 


Note-se que, quando № > ee (ou quando N é grande comparado com n), (22) 
se reduz a (18), que pode escrever-se 


P(X-a) = м pr m 
e (23) se reduz a 
= пр s? = npq (25) 


de acordo com as duas primeiras entradas na Tábua 4-1, pág. 109. Tais resultados já 
eram de esperar-se, já que, para N grande, a amostragem sem reposição é pratica- 
mente equivalente à amostragem com reposição. 


A DISTRIBUIÇÃO UNIFORME 


Diz-se que uma v.a. X é uniformemente distribuída em а « x < b se sua 
função de densidade é 


6 
0 em caso contrário (28) 


1/(b-a) a<z=<b 
ө = | 
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a distribuição é chamada distribuição uniforme. 
A função de distribuição é dada por 


E <a 
Р): = Pes = M a)/(b — a) <u<b (27) 
4 x>b 


A média e a variáncia sáo, respectivamente, 


je E ata 4 5) v? E ET = а)? (28) 


A DISTRIBUIÇÃO DE CAUCHY 


Uma v.a. X é distribuída segundo Cauchy, ou tem distribuição de Cauchy, se 
a função de densidade de X é 
pm a 
o) = quero) 
Esta função de densidade é simétrica em relação a x = 0, de modo que sua 
média pode ser considerada como zero. Todavia, a variância e os momentos de 


ordem mais alta não existem, como também não existe a função geratriz de mo- 
mentos. Mas a função característica existe, e é dada por 


lo) = enn (30) 


a>0 -o<g<ow (29) 


A DISTRIBUIÇÃO GAMA 


Uma v.a. X tem distribuição gama se sua função de densidade é 


at te vB >0 
> d 
fla) = В“ T(a) (a, 8 > 0) (31) 
0 x<0 
onde Tía) éafuncáo gama (v. Apêndice A). A média e a variância são 
“n= af s? = af? (82) 
A função geratriz de momentos e a função característica são, respectivamente, 
M(t) = (1- ft)" plo) = (1— Bio) = (33) 


A DISTRIBUIÇÃO BETA 


Uma v.a. X tem distribuição beta se sua função de densidade é 
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е a 
fx) = | Bla, B) теше, (a, B > 0) (34) 


(0 em caso contrário 
onde Bla, 8) é a função beta (v. Apéndice A). Em vista da relação (9) do Apéndi- 
ce A, entre as funções beta e gama, a distribuição beta pode também ser definida 
pela função de densidade 


ara 901-0) 0<х<1 
"n 


fla) = 4T()r()' (35) 
|, 0 em caso contrário 
onde а, В são positivos. A média e a variância são 
M 4 bus ag Е 
СЕИ “= GCEBPG- BT 80) 
Para « 1, В > 1 existe uma única moda em 
il 
"mod = 48-2 (37) 
A DISTRIBUICAO QUI-QUADRADO 
Sejam Xi, Xs, ..., Xv vvariáveis aleatórias independentes, normalmente 
distribuídas, com média zero e variáncia 1. Consideremos a variável aleatória 
AHX БХ (88) 
onde X° se lê “qui-quadrado”. Pode-se então mostrar que, para x >0. 
2 1 P" gata Р 
PEGO) = sarna $ uomo e du (29) 


A distribuição definida por (39) é chamada distribuição qui-quadrado e v 
é o número de graus de liberdade, A função de densidade correspondente é dada 
por 1 
PEN A 1 22/2 >o 
o) = 4 97209)" É à (40) 
2 «0 


© 


Vê-se que a distribuição qui-quadrado é um caso especial da distribuição gama 
com а = v/2, В = 2. Assim, 

=» = 2, M(t) = (1-207 ?, qlo) = (1—2i) "* (41) 
Para v grande (v > 30) pode-se mostrar que V 23 — V/2v — 1 tem distribuição 


muito aproximadamente normal com média O e variância 1. 
As observações acima sintetizam-se no seguinte teorema. 


em asas 
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Teorema 4.3:Sejam Xi, X», ..., X, variáveis aleatórias independentes normal- 
mente distribuídas com média O e variância 1. Então x° = Xi + Xi 
«+ X? tem distribuição qui-quadrado com v graus de liberdade. 


Dois outros teoremas, úteis para nosso trabalho ulterior, são: 


Teorema 4.4:Sejam Ui, Us, ..., Ux variáveis aleatórias independentes com dis- 
tribuição qui-quadrado com v, v, ++» Yy Braus de liberdade respec- 
tivamente. Então, sua soma W = Ui-- Us -++ E Us tem distri- 


buigio qui-quadrado com v, +r, + >: + v, graus de liberdade. 


Teorema 4.5:Sejam E, e А variáveis aleatórias independentes. Seja V: com dis- 
tribuição qui-quadrado com y, graus de liberdade, enquanto que 
V = V, + V, tem distribuição qui-quadrado com v graus de liberdade, 
sendo v>»,. Então, V, tem distribuição qui-quadrado com v —», 
graus de liberdade. 


Ao lidar com a distribuição qui-quadrado, a distribuição f (abaixo), a distri- 
buição F (pág. 167), e outras, é comum, em estatística, usar o mesmo símbolo 
tanto para designar a variável aleatória como um valor dessa variável. Assim, os 
percentis da distribuição qui-quadrado com v graus de liberdade são denotados por 
Xv» ou abreviadamente por Xj (у subentendido), e não por z», OU Xp (v. 
Apêndice E). Trata-se de uma notação ambígua, que exige atenção e cuidado do 
leitor, especialmente quando da mudança de variáveis na função de densidade. 


A DISTRIBUIÇÃO + DE STUDENT 


Se uma variável aleatória tem função de densidade 
vtl 
FC ана 
AS Ti 
zx 


E 
diz-se que ela tem distribuição t de Student, ou, abreviadamente, distribuição t, 
com v graus de liberdade. Se > é grande (v 280) o gráfico de f(t) se aproxima da 
curva normal padronizada, tal como indicado na Fig. 4-2 (v. Problema 4.161). 
Os percentis da distribuição 1 para v graus de liberdade são denotados por tp.» ou 
abreviadamente por fp. O Apéndice D contém uma tabela dando esses valores. 
Como a distribuição f é simétrica, й— = —tp; por exemplo, foos = — tos. 
Para a distribuição t, temos 


-o icm (48) 


ft) = 


u= e = 5 (и> 9) (48) 


pes 


O teorema que segue é importante para nosso trabalho ulterior. 
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Ho 


Fig. 4-2 


Teorema 4.6:Sejam Y e Z variáveis aleatórias independentes, Y sendo normalmente 
distribuída com média zero e variância 1, e Z tendo distribuição qui- 
quadrado com y graus de liberdade. Então, a variável aleatória 

Ps 1 
== 44 
V ETA (44) 
tem distribuição t com у graus de liberdade. 


A DISTRIBUIÇÃO F 


Uma variável aleatória tem distribuição F (em honra de R.A.Fisher) com », 
e v, graus de liberdade, se sua função de densidade é dada por 


TM 


si gg ir) Mu deg i) Оа аде u>0 (45) 


LO u <0- 


Os percentis da distribuição F рага У,у, graus de liberdade denotam-se por 
Fp,» vgs OU abreviadamente por Fp (1, v; subentendidos). O Apêndice F contém 
uma tabela dando tais valores nos casos p = 0,95 e p = 0,99. 
A média e a variância são, respectivamente, 
_ Y m" na 2vi(v, + v,— 2) 
"i А" 77-006 2P 


(454) — (8) 


A distribuição apresenta moda única em 


JE un 


1 


Seguem-se dois teoremas importantes para nosso estudo ulterior. 
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Teorema 4.7: Sejam V, e V, variáveis aleatórias independentes, com distribuição 
qui-quadrado com v, ер, graus de liberdade, respectivamente. Então 
a variável aleatória Vv 


Y 1 (48) 


= Voos 
tem distribuição F com у, еу, graus de liberdade. 


Teorema 4.8: F- = WE; 


1—р, gs Ya БАЛЛ 


RELAÇÕES ENTRE AS DISTRIBUIÇÕES 
QUI-QUADRADO, t E F 


Teorema 4.9: Е, 


1,1,0 70 q, 


2 
Teorema 4.10: E,, = Хр,» 


A DISTRIBUIÇÃO NORMAL BIVARIADA 


Uma generalização da distribuição normal para duas variáveis aleatórias 
contínuas X e Y é dada pela função de densidade conjunta 


Hay) = EA HE 2 (= E n 


(37 ЕЕ (49) 


onde ~» «x < о, —9 «1 X9; ny p, são as médias de X e E жый > 
são os desvios padrões de X e Y e p é o coeficiente de correlação entre X e Y. (49) 
é comumente designada distribuição normal bivariada. 


Em qualquer distribuição conjunta, a condição р = 0 é necessária para que 
haja independência das variáveis aleatórias (v. Teorema 3-15). No caso de (49), tal 
condição é também suficiente (v. Problema 4.51). 


DISTRIBUIÇÕES DIVERSAS 


Nas distribuições relacionadas abaixo, as constantes a, &,D,... são 


el 


DISTRIBUICÕES ESPECIAIS DE PROBABILIDADE 169 


constantes positivas, a menos que se indique o contrário. A função característica 
olo) se obtém a partir da função geratriz de momentos (quando esta é dada), 


fazendo t = їо. 


1. Distribuição Geométrica. 


f(z) = P(X=2) = par 


eb dud 


р 


M(t) = 


moss 


EG 
1-— get 


A variável aleatória X representa o número de provas de Bernoulli necessárias 
para a ocorrência do primeiro sucesso. p é a probabilidade de sucesso em uma 


prova. 


Ге] 


Ey E 
=> 


n 


. Distribuição binomial negativa, ou de Pascal 


/ г — 
fa) = Р(Х=ў = (7 ij 


pq =P L cs 
si 8 
M(t) = (1 — де?” 


A variável aleatória X representa o número de provas de Bernoulli até aquela 
(inclusive) em que ocorre o sucesso de ordem r. O caso especial r=1 dá a dis- 


tribuição geométrica 


3. Distribuição exponencial. 
қа) ae" 4>0 
à = 
0 r«0 
1 1 
pec Seg We 
4. Distribuição de Weibull 
fe) abee x20 
[3 == 
0 z«0 


p= ara +) ё = а (1 +$) = r(1 +3)] 


5. Distribuição de Maxwell 


Vin gte x20 
f(x) = 
0 


= 
1 
nm 
ê | 
а 


|, 
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Problemas Resolvidos 
A DISTRIBUIÇÃO BINOMIAL, 


4.1. Determine a probabilidade de, em três jogadas de uma moeda, aparecer (a) 
3 caras, (b) 2 coroas e 1 cara, (c) ao menos 1 cara, (d) no máximo 1 coroa. 


Método 1. 
Designamos “cara” рог Н e “coroa” por Т, e seja HTH, por ex., cara na 18 
jogada, coroa па 28, сата па 32 
Сото сайа jogada comporta duas possibilidades (cara ou coroa), há um total 
de (2) (2) (2) = 8 resultados possíveis, isto é, 8 pontos amostrais no espaço amostral. 
São eles: 
HHH, HHT, HTH, HTT, TTH, THH, THT, TTT 


No caso de uma moeda honesta, a probabilidade de cada resultado é 1/8. Assim 
(РЗ сша) = P(HHH) = i 


(БЭР (2 coroas e 1 сага) = Р(НТТ U TTH U THT) 


y = PITT) 4 POTH) + parar) = В+р+ = 8 
(c) P (ao menos 1 cara) =P (1, ou 2, ou 3 caras) = 
= Р(1 cara) tP (2 caras) =P (3 caras) = 
= P(HTTUTHTUTTH) + PIBETUHTHU THH) + P(HHH) 
= Р(НТТ) + P(THT) + P(TTH) + P(HHT) + Р(НТН) + P(THH) + 
+ P(HHH) = 1 
Alternativamente, 1 7 
P (ao menos 1 cara) = 1 — P (nenhuma cara) = i- РОЛЕТ) = 1- сев 


(d) P (no máximo 1 coroa) =P (0 coroas ou 1 coroa) =P (0 coroas) + P (1 coroa) = 
= P(HHH) + P(HHT u HTH u THH) 
= P(HHH) + P(HHT) + P(HTH) + P(THH) 
= 1 
2 


E: 
8 


Método 2 (utilizando a fórmula). 


oram (QR - 1 


(b)P (2 caras e 1 coroa) ¿AVIV à 
-@@@-! 


DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE 171 


(c) P (ao menos 1 cara) = P (1, 2 ou 3 caras) =P (1 cara) +P (2 caras) +P (3 caras) = 


MA OVA, NY 7 
1/12/12 2/12/12 312 2/ 3 
Alternativamente, 0 3 
Р (ao menos 1 cara) =] — P (nenhuma сага) = 1 — 3)(1V(1Y.- T 
м 0/42/A2 8 
(d)P (no máximo 1 coroa) = P (0 coroas ou 1 coroa) = P (0 coroas) +P (1 coroa) = 
AMARO A DD) „1 
—XB7Jx2/X2 2/12/12 2 
Note-se gue se pode também utilizar a notagáo das variáveis aleatórias. Assim, p.eX., 
se X é a v.a. que denota o número de caras em 3 jogadas, (c) pode escrever-se 
Р (ao menos 1 сага) = P(X<1) = P(X=1) + P(X=2) + P(X=3) = т 


Utilizaremos ambas as notações, sem preferência. 


4.2. Determine a probabilidade de que, em 5 jogadas de um dado, apareça о 3 
- (a) duas vezes, (b) no máximo uma vez, (c) ao menos duas vezes. 


Seja X, variável aleatória, o nümero de vezes que o 3 aparece nas 5 jogadas. 


Ti 
emos 1 


Probabilidade de 3 em uma jogada — p — $ 


Probabilidade de não-3 em umajogada = q = 1— р = 5 


> di " 
(e) P (3 duas vezes) = P(X=2) = (Б) (9 - EM 


(b)P (3 no máximo uma vez) = P(X&1) = P(X=0) + Р(Х = 1) 


(50 @+ Ga) 


_ 3125 ‚ 3.125 _ 3.125 
7776 7.7716 3.888 


I 


(c) P (3 ao menos duas vezes) 


= P(X>2) 
Р(Х =2) + Р(Х —8) + P(X 4) + Р(Х = 5) 


«СЛЕ (90070 + СОЮ 


625 125 , 25 i 763 


= 5888 3.888 "7.116 7776 — 3.888 


“Y 
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4.3.Em uma família de 4 filhos, determine a probabilidade de (a) ao menos 1 
menino, (b) ao menos 1 menino e ao menos 1 menina. (Admita igual a 1/2 
a probabilidade de nascer um menino.) 


| nA wu fA. s 
(a) P (1 menino) — H GG) es P (2 meninos) — НІВ) (2) = в 
3 a i 
P (3 meninos) = (2) E) zi i Pigmentos) = (06) (3) E T 


Então 
P (ao menos 1 menino) = P (1 menino) +P (2 meninos) +P (3 meninos) + 
+P (4 meninos) = 


Outro Método. 


P (ao menos 1 menino) = 1 — P (nenhum menino) 
xa 
cdd 1 15 
$ G ) = 1—16 = 16 


(b)P (ao menos J menino e ao menos 1 menina) = 


=1 — P (nenhum menino) — P (nenhuma menina) — | — 1 l1 7 


16 16 8 
Poderíamos também resolver este problema fazendo a variável aleatória X representar 
o número de meninos em famílias com 4 filhos. Então, p.ex., (a) se escreveria 
Р(Х >ї) = Р(Х =1) + P(X =2) + P(X=3) + P(X=4) = E 


4.4. De 2.000 famílias com 4 filhos cada, quantas poderíamos esperar terem (a) ao 
menos 1 menino, (b) 2 meninos, (c) 1 ou 2 meninas, (d) nenhuma menina? 


Referindo-nos ao Problema 4.3, vemos que 


(2) Nº esperado de famílias com ao menos 1 menino — 2.000 ( 16 ] = 1.875 


n 3 
(b) NO esperado de famílias com dois meninos = 2.000 - P (2 meninos) = 2.000 $7 750 


(c) P (1 ou 2 meninas) =P (1 menina) +Р (2 meninas) = 


=P (1 menino) +P (2 meninos) = i E i 


cojen 


45. 


46. 


ал. 
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Nº esperado de famílias com 1 ou 2 meninas = 0, = 1250 


(d) Nº esperado de famílias com O meninas = exo (1) = 125 


Se 20% das pegas produzidas por uma máquina acusam defeito, determine a 
probabilidade de que, em 4 peças escolhidas ao acaso, (a) 1, (5) 0, (c) menos de 
2 sejam defeituosas. 


A probabilidade de uma peça defeituosa é p = 0,2, a de uma peça não-defeituosa 
é¿é1-p=q=05,8.Seja X a v.a. que representa o número de pegas defeituosas. Entáo 


(а) P(X=1) 


MIS = 0,4096 
" 


(5) P(X=0) 


Ш 


ӨГ = 0,4098 


(e) Р(Х<2) 


[i 


P(X=0) + P(X=1) 
0,4096 + 0,4096 = 0,8192 


Determine a probabilidade de obter o total 7 ao menos uma vez em trés jogadas 
de um par de dados. 


Em uma única jogada de um par de dados, a probabilidade do total 7 é 1/6 (v. 
Problema 2.1, pág. 66), de modo que a probabilidade de náo obter o total 7 em uma 
jogada é q =1-p=5/6. Então 


я o 3 
P (náo-7 em trés jogadas) — À t E = 125 
0/16 


16 216 
Р (7 ao menos uma vez em três jogadas) = 1 — E = En 


Determine a função geratriz de momentos de uma variável aleatória distribuída 
binomialmente. 


Método 1. 


Se X é distribuída binomialmente, 


f) = P= = (pre т 


174 PROBABILIDADE E ESTATÍSTICA 


Então, a função geratriz de momentos é dada por 


М = Ele) = У efle) 


L2 


= Ж (Doe 
i-o 


= (q+ pet)» 


Método 2 
Para uma sequência de п provas de Bernoulli, definamos 
| 0 se ocorrer falha па j.ma prova 


X; = E 
i 1 se ocorrer sucesso na /.MA prova 


Então, as Xj são independentes e X = X, + X3 +--- + Хр. Para a função geratriz de mo- 
mentos de Xj temos 


Mit) = 69 + ep = q+ pet G=1,2,...n) 
Então, pelo teorema 3-9, pág. 114, 


M(t) = M0) Mt) Mat) = (q+ ре)" 


4.8. Prove que a média e a variância de uma variável aleatória distribuída binomial- 
mente são, respectivamente, p = np © c? = npq. 
Procedendo de acordo com o Método 2 do Problema 4.7 temos, para j = 1, 2, ... n, 
Е(Х) = 09 +1р = p 
Var(X) = BMX, pP] = (0 — pq (1— p?p 
= р + Фр = рч(р+ч) = ра 
Então, ш = B(X) = E(X) + E(X) ++ +E(X,) = np 


s? = Var(X) = Уа (Ху) + Var (Xa) + «+: + Var(X,) = "pq 
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onde utilizamos o Teorema 3-7 para o?. 

Os resultados acima também podem ser obtidos (embora com maior dificuldade) 
diferenciando-se a função geratriz de momentos (v. Probl. 3.38) ou diretamente a partir da 
função de probabilidade (v. Probl. 4.152). 


49, Se a probabilidade de uma peça defeituosa é 0,1, determine (a) a média e (b) o - 


desvio padrão do número de peças defeituosas em um lote de 400 peças. 


(а) Média y = np = (400)(0,1) — 40, ie., podemos esperar 40 peças defeituosas. 
(b) Variáncia 02 = пра = (400)(0,1)(0,9) = 36. Logo, o desvio padrão é 0="/36 = 6. 


A LEI DOS GRANDES NÚMEROS NO 
CASO DE PROVAS DE BERNOULLI 


4.10. Prove o Teorema 4-1, a lei (fraca) dos grandes números, para O caso de provas 
de Bernoulli, 


Pela desigualdade de Tchebichev, pág. 119, se X é uma variável aleatória com 
média pe variância o?, finitas, então 
$ 


Н Р(х) < us 


Em particular, se Х tem distribuigao binomial ou de Bernoulli, então, М = np, 0 = /npge 
(1) se torna 


2) P(X — пр; > hkvnpg) 
s (|&-ь 


(3) fica 


Fazendo « = k 


e tomando o limite quando n > « temos, conforme desejado, 


А х | 
lim e(|ž-p| >») = @ 


no 


O resuítado decorre também diretamente do Teorema 3-19, pág. 119, com 


Sa = X, а = np, с = Vapi. 


4.11. Dé uma interpretação da lei (fraca) dos grandes números para o caso do apare- 
cimento da face 3 em sucessivas jogadas de um dado. 


ттщ. 
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A leí dos grandes números assegura, neste Caso, que a probabilidade de a propor- 
ção do número de ocorrências da face 3 diferir de 1/6 por um valor e > 0 arbitrário 
tende para zero quando т ^ ?- 


Y A DISTRIBUIÇÃO NORMAL 


4.12. Determine a área sob a curva normal padronizada (а) entrez=0ez= 152. 
(b) entre 2= -0,68ez - 0, (c) entre z = 0,46 ez - 221, (d) entre z = 0,81 e 
z = 194, (e) à direita de z = 1,28. 


(a) Usando a Tábua do Apêndice С, percorramos a coluna 2 até a altura da entrada 1,2, 
e caminhemos nela até a coluna marcada 0. O resultado, 0,3849, é a área procurada 
e representa a probabilidade de Z estar entre 0 e 1,2. Assim, 


12 ЕЕЕ 
P(O<Z<12) = aí cunda = 0,3849 "Ni EN 
У £r do i 


==0 2512 


Fig. 4-3 


[ (b) Área procurada = área entre 2 =0 e z=+0,68 (por simetria). Percorrendo a coluna 
z até a entrada 0,6 e, em seguida, caminhando à direita até a coluna 8, chega-se ao 


valor 0,2517, que é a área procurada e representa à probabilidade de Z estar entre 


-0,68 e 0. Assim, 


А 1 (? A 
P(-068<Z<0) = — | е" du 
= 0,6% 


VB - 


eU du = 0,2517 


(є) Área procurada = (área entre 2 
(área entrez=0 e 2=2,2 
(área entre z=0 e z= 46)= 
+(áreaentrez=0 e 2=2,21) 
= 0,1772+0,4864= 0,6636. 


+ 


A área, 0,6636, representa a probabilidade de Z estar entre - 0,46 e 2,21. Assim, 
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D 


P(—046 <Z <2,21) L f WER ati dg 
ут 20,46 


0,46 2,21 


1 p 
+ |) e/2 du 
Vs do Fig. 4-5 
046 2, 1 221 : 
2 =P edu + = о ац = 0,1772 
27 Jo 7 


+ 0,4864 = 0,6636 


(d) Área procurada = (áreaentrez= 0 e z= 1,94) 
— (áreaentrez= 0 e z= 0,81) 
= 0,4738 — 0,2910= 0,1828. 

É o mesmo que P(0,81 <Z <1,94). 


(е) Área procurada = (área entre z =-1,28 e 2 = 0) 
+ (área à direita dez = 0) 
= 0,3997 + 0,5 =0,8997. 
É o mesmo que 
P(Z>-1,28). 


Fig. 4-7 


4.13. Se a expressio'“úrea” se refere à área sob a curva normal padronizada, deter- 
mine o valor ou os valores de z tais que (a) área entre O e z = 0,3770, (b) área 
à esquerda de z = 0,8621, (c) área entre - 1,5 ez = 0,0217. 


(a) Na tábua do Apêndice C, a entrada 0,3770 está localizada à direita da linha marcada 
1,1 e sob a coluna 6. Então, 2 = 1,16. 


Por simetria, z = — 1,16 é o outro va- 
lor de z. Assim, 2 = + 1,16. O problema 
é equivalente a resolver, em relação a z, à 
equação. 


ia 
f едц = 0.8770 
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(b)Como a área é maior do que 0,5, z deve ser positivo. 
A área entre 0 c z é 0,8621 — 0,5 = 0,3621, donde 2 = 1,09. 


Fig. 4-9 


(с) Se z fosse positivo, a área seria maior do que a área entre -1,5 e 0, que ё 0,4332; 
logo, z deve ser negativo. 


Caso 1:2 negativo, à direita de —1,5. 

Área entre -1,5 e z = (area entre —1,5 e 0) — (área entre 0 e z) 

0,0217 =0,4332 — (área entre 0 e z). 

Então, a área entre 0 e z 60,4332 — 0,0217 20,4115, donde z =-1,35. 


Fig. 4-10 


Caso 2: z negativo, à esquerda de -1,5. 

Área entre z e -1,5 = (área entre z e 0) — (área entre 71,5 e 0) 

0,0217 = (área entre 0 e z) — 0,4332 

Então, a área entre O e z 60,0217 + 0,4332 —0,4549 e z = —1,694 (por interpolação 
linear); ou, com precisão um pouco menor, 7 = 1,69. 


2 -1,5 


Fig. 411 


4.14. O peso médio de 500 estudantes de sexo masculino de certo colégio é 151 1h 
e o desvio padrão 15 Ib. Supondo os pesos distribuídos normalmente, deter- 
mine quantos estudantes pesarão (a) entre 120 e 155 Ib, (b) mais de 185 Zb. 


(a) Os pesos entre 120 e 155 Ib podem efetivamente acusar qualquer valor de 119,5 a 
155,5 Ib, supondo-os anotados com aproximação de meia libra. 
119,5 lb em unidades padronizadas =(119,5 — 151)/15 =- 2,10 
155,5 lb em unidades padronizadas =(155,5 — 151)/15= 0,30 
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= (área entre z =-2,10 e z 20,30) 
= (área entre = -2,10ez —0). 

+ (área entre z = 0 e z = 0,30) 

= 0,4821 +0,1179 = 0,6000 


Proporção procurada de estudantes 


Então o número de estudantes que pesam entre 120 e 155 Ib é 500 (0,6000) = 300. 


(b) Os estudantes que pesam mais de 185 lb devem pesar pelo menos 185,5 Ib. 
185,5 Ib em unidades padronizadas = (185,5 — 151)/15 =2,30 
Proporção procurada: (área à direita de z = 2,30) = (área à direita de z = 0) 
— (área entre z =0 e z =2,30) =0,5 — 0,4893 20,0107 


2,30 
Fig. 4-13 1 
Então, o número de estudantes que pesam mais de 185 /b é 500(0,0107) =5. 


Se W denota o peso de um estudante escolhido ao acaso, podemos sintetizar os resul- 
tados acima escrevendo 


P(119,5< W<155,5) = 0,6000 P(W 22185,5) = 0,0107 


4.15. O diámetro interior médio de uma amostra de 200 arruelas produzidas por 
uma máquina é de 0,502”, e o desvio padráo 0,005”. As dimensões extremas 
toleradas para esses diâmetros são 0,496” e 0,508”; fora desses limites, as 
arruelas são rejeitadas. Determine a percentagem de arruelas defeituosas 
(rejeitáveis) produzidas pela máquina, supondo os diâmetros distribuídos 
normalmente. 


0,496 em unidades padronizadas = (0,496 — 0,502)/0,005 = 
0,508 em unidades padronizadas = (0,508 — 0,502)/0,005 = 


Proporção de peças não-defeituosas: 
(área sob a curva normal entre z =- 1,2 e z = 1,2) 
=(duas vezes a área entre z =0 e z = 1,2) = 2(0,3849) =0,7698, ou seja, 77% 
Percentagem de peças defeituosas: 100% — 77752 23% 
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Note-se que se considerarmos os intervalos 0,496 e 0,508 representando efetivamente 
0,4955 e 0,5085, o resultado acima se modifica ligeiramente. A menos de dois algarismos 
significativos, entretanto, os resultados coincidem. 


Fig. 4-14 


4.16. Determine a função geratriz de momentos da distribuição normal geral. 


Temos 
1 E 2/2092 
мау) = (ех) = f ptr 020% de 
oy 2r J-o 
Fazendo (x— 4)/s = na integral, de modo que х = p+ ov, dx = о dv, 
temos 
o = = f. quie uas = AA f. ¿00 dy 
V2r E Эл “== 
Fazendo agora y— gt — w encontramos 
Mb = ee (1 N ed) = еш (ойл) 
y2z doa 


APROXIMAÇÃO NORMAL DA DISTRIBUICAO BINOMIAL 


4.17. Determine a probabilidade de obter entre 3 e 6 caras inclusive em 10 jogadas 
de uma moeda, empregando (a) a distribuigáo binomial, (5) a aproximação 


normal da distribuição binomial. 


(a) Seja X a variável aleatória que dá o número de caras em 10 jogadas. Então 


ll 
„==. 
ж = 


'( © _ 105 


: i0V/1V(1V _ 15 
и (5)6) (5) 128 — 3) =й? 


1\* _ 03 - 
(3) = 256 Р(Х =6) 


^ 105 
512 


1l 
o 
m 
"we 
„иы. Ж. эу, 
зы жы 
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Então, a probabilidade é 


_ 15 , 105 , 63 , 105 _ 99 _ qm. 
PG«X«8) = тоз + gig + 255 ^ 512 ^ 108 ^ 070 
Probabilidade 
E: 
A 
E 
+ | 1—1 
0 1 2 3 4 5 8 7 8 9 10 


Probabilidade 


03 


Número de “caras” 


Fig. 4-16 


(b)As Figuras 4-15 e 4-16 exibem o gráfico da distribuição de probabilidade para o 
número de caras em 10 jogadas da moeda; a Fig. 4-16 considera os dados como se 
fossem contínuos. A probabilidade procurada é a soma das áreas dos retángulos 
sombreados na Fig. 4-16, e pode ser aproximada pela área sob a curva normal corres- 
pondente (tracejada). Tratando os dados como se fossem contínuos, vê-se que 3 a 6 
caras podem ser consideradas como 2,5 a 6,5 caras. Outrossim, a média c a variância 
da distribuição binomial são dadas por џ = np = 10(1) =5 € 
e = упра = V(10)(3)(3) = 1,58. Ora, 

2,5 em unidades padronizadas = (2,5 — 5)/1,58 = —1,58 
6,5 em unidades padronizadas = (6,5 — 5)/1,58 — 0,95 
Probabilidade procurada = (área entre z =-1,58 e z=0,95) 
=(área entre z=-1,58 ez =0) + (área entrez = 0 e z = 0,95) 
=0,4429 + 0,3289 =0,7718, 
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valor bastante aproximado do verdadeiro valor obtido na parte (2). Quanto maior 
for п, tanto melhor será a aproximação. 


Fig. 4-17 


4.18. Joga-se uma moeda 500 vezes. Determine a probabilidade de o número de 
caras náo diferir de 250 (a) por mais de 10, (b) por mais de 30. 


1\ = 11,18 


nem Ө = 250 а= yT = ala 2) 
A 242 


(a) Queremos a probabilidade de o número de caras estar entre 240 c 260, ou conside- 
rando os dados como contínuos, entre 239,5 e 260,5. 
239,5 em unidades padronizadas = (239,5 — 250)/11,18 = — 0,94 
260,5 em unidades padronizadas .94 
Probabilidade = (área sob a curva normal entre z = — 0,94 e z 0,94) 
= (duas vozes a área entre z = 0 e z = 0,94) =2 (0,3264) =0,6528. 


i (b) Queremos a probabilidade de o nümero de caras estar entre 220 e 280, ou conside- 
tando os dados como contínuos, entre 219,5 e 280,5. 
219,5 em unidades padronizadas = (219,5 250)/11,18 2— 2,73 
280,5 em unidades padronizadas =2,73 
Probabilidade = (duas vezes a área sob a curva normal entre z =0 ez 
(0,4968) = 0,9936. 
Podemos, pois, esperar que o número de caras não difira do valor esperado (250) por 
) mais de 30. Assim, pois, se acontecer que o número efetivo de caras seja 280, teremos 
| 


razões para admitir que a moeda é viciada. 


4.19. Joga-se um dado 120 vezes. Determine a probabilidade de a face 4 aparecer 
(а)по máximo 18 vezes, (b) no máximo 14 vezes. (Supõe-se o dado não- 
viciado). 

A face 4 tem probabilidade p = | de aparecer е probabilidade q ¿de 
náo aparecer. 


(a) Queremos a probabilidade de o número de 4 estar entre 0 e 18, o que é dado 


exatamente por 
120/10 */5 V? | (120 ( i-a FR Lat PC a 
ү. Ө (8) T) 6 (ё Eto e) le) * 
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em vista, ontretanto, do trabalho exaustivo de cálculo, utilizaremos a aproximação 
normal. 

Considerando os dados como contínuos, segue-se que O a 18 pode ser conside- 
tado como -0,5 a A 5. Outrossim, 


B^ 


u=np= 120(%) —20e0-ynpj = Ao S) | — 4,08 


Entào 
— 0,5 em unidades padronizadas = (— 0,5 — 20)/4,08 = — 5,02 
18,5 em unidades padronizadas =— 0,37 
Probabilidade = (área sob а curva normal entre z = ~ 5,02 e z = ~ 0,37) 
=(área entre z=0 e z =— 5,02) — (área entrez -0ez =— 0,37) = 0,5 ~ 0,1443 = 
70,3557. 


(b) Procedemos como em (a), substituindo 18 por 14. Entáo 
— 0,5 em unidades padronizadas = — 5,02, 14,5 em unidades padronizadas = — 1,35 
Probabilidade = (área entre z = — 5,02 ez =— 1,35) = (área entre z = 0 e z =— 5,02) 
— (área entre z = 0 e z =— 1,35)=0,5 — 0,4115 = 0,0885. 
Segue-se que, em repetidas seqüencias de 120 jogadas de um dado, a face 4 deveria 
aparecer 14 vezes ou menos em cerca de 10% dessas jogadas. 


A DISTRIBUIÇÃO DE POISSON 
4.20. Estabeleça a validade da aproximação de Poisson para a distribuição binomial. 


Se X é distribuída binomialmente, então 


A n 
47) р(Х = = e que 
1 ( x) (1) q 


onde E(X)- np. Seja А = пр Яе тойо дие p = A/n. Então (1) fica 


nen (ШС 


= nro 1-2). (n—x F1) (11) 


alar 


Ora, quando, л — c5, 


enquanto que 
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(2) 


(3) 


[I 


6) 


4.21. 


4.22. 


utilizando o bem conhecido resultado do Cálculo 


Segue-se que, quando y; - Mas A permanece fixo (isto é, p >0), 


MEA 


Р(Х =) — 
que ё а distribuigáo de Poisson. 
Outro Método. 


A função geratriz de momentos da distribuição binomial é 
(q + реў” = (1— p+ pe" = (1 plet – 1)]" 


Se А = mp de modo que p = Mn, a expressão acima se torna 


Met 1)7* 
КЕ ] 


E 
eMet=1) 


Quando т >>» este valor tende para 


que é a função geratriz de momentos da distribuição de Poisson. O resultado procurado 
decorre então da aplicação do Teorema 3-10, pág. 114. 


Verifique que a função limite (2) do Problema 4.20 é efetivamente uma 
função de probabilidade. 


Primeiro, observamos que Р(Х = х) > 0 para x=0, 1,..., dado que AO. 
Em segundo lugar, temos 


e S Xe M 
PX=%w) = = oie Er 
P3 ( ) P3 z! 220 =! 


о que completa а verificação. 


Dez por cento das peças produzidas por certo processo de fabricação acusam 
defeitos. Determine a probabilidade de que, em uma amostra aleatória de 10 
peças, exatamente duas sejam defeituosas, utilizando (a) a distribuição 
binomial, (b) a aproximação de Poisson. 


(a) A probabilidade de uma peça defeituosa é p=0,1. Seja X o número de peças defei- 
tuosas entre as 10 escolhidas. Então, pela distribuição binomial. 
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P(X-23) = (eara = 0,937 ou 0,19 


(Б) Temos À = mp = (10)/0,1) = 1. Então, pela distribuição de Poisson 


Meza Be-1 
sm P=} = are — 0,1839 ou 0,18 


P(X=a) = 


Em geral, a aproximação é boase P<01 e A=1p<B. 


4.23. Se a probabilidade de um indivíduo acusar reação negativa à injeção de deter- 
minado soro é 0,001, determine a probabilidade de que, em 2.000 indivíduos, 
(a)exatamente 3, (b) mais de 2 indivíduos acusem reação negativa. 


Seja X a v.a, que dá o número de indivíduos que acusam reação negativa. X tem 
distribuição de Bernoulli, mas como as reações negativas aqui se supõem eventos raros, 
podemos considerar X como distribuída segundo Poisson. 


е5 
Bos) = E onde А = up = (2000)(0,001) = 2 
3e—2 
(a) px=s = FIT = 0180 
e P(X»2) = 1 |PX=0) | MX=1) + P(X=2)] 
Е 200—2 2e? 2le-2 
"C" hu ait ^ m5. 
= 1— 5e? = 0,323 


O cálculo exato pela distribuição binomial exigiria muito mais trabalho. 


O TEOREMA DO LIMITE CENTRAL >. 


4.24. Verifique a validade do teorema do limite central para uma variável aleatória 
X distribuída binomialmente, estabelecendo assim a validade da aproximação 
normal para a distribuição binomial. 


A variável padronizada correspondente a Yé X* = (X — np)/Vmpq € a função 
geratriz de momentos de X* é 
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Е(*) = E(etX-np)/ Vara) 


= e tnp! Vara E (etx/Vnpa) 


D 


n п 
e— tap! Vnpa 2 etr/ Vna C ee 
= 


Il 


а 
g-tup/Vnpa Y (урет )ygn-* 
220 NU 


eg tup! Vaza (q + pet! Vaza уп 


H 


[e tri Упа (q + pet! Vaza |n 


(де t»! Vaza + peta! Vara үп 


Utilizando o desenvolvimento 
2 
a = 1+и+ A * 


obtemos 


де Мпа + peta/ Viva = i: ERU NU ү m 


tq o 20 ) 
sol ta E: ¿o а 
* ol + Vnpa 2npq 
pap 9) |, 
PF 2npq za 


Ш 
a 
$ 


> 9 
a bg do os 


е n 
i tx" = Sua n 
Assim, E(ex*) ( 1+ 2n + ) 


Mas quando п * o membro direito tende рага et*/2, que é a função geratriz de 
momentos da variável normal padronizada. O resultado desejado decorre, pois, do 
Teorema 3-10, página 114. 


| 4.25. Prove o teorema do limite central (Teorema 4-2 página 161). 


| Para n=1,2,..., temos S, = X, +X, + b X, Ora, XX 
têm cada uma média Le variância o2. Assim 
E(S$, = E(X) + Е(Х) + eee + E(X,) = та 


е сото os Жу são independentes. 


| Var(S,) = Var (X;) + Var (Xa) + o + Var (Xn) = no? 
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Segue-se que a variável aleatória padronizada correspondente абу é 


A função geratriz de momentos para S5 é 
E(eis) = Efet(S mio Yn] 


l 


| 


Il 


Eje =u)/o Vu] . Е[е&Хә—и)/е Уп | sie 


E [ét OG - 3/6 Yn gitXs 1010 Vn. + Хава] 


ех, 1/0 Үп | 


(et 10/0 ра 


onde, nos dois últimos estágios, levamos em conta os fatos que os X, são independen- 
tes e são identicamente distribuídas. Mas pelo desenvolvimento de Taylor, 


Е [е1 —н)/т\Уп | 


de modo que 


il 


2o?n 


єх, AUX, — д)? 
E y Pa, PH m =] 


oyn 


Ё 


Mas o limite desta expressão quando n>% é et*/2, que é a função geratriz de 
momentos da distribuição normal padronizada. O resultado desejado decorre, pois, do 


Teorema 3-10, página 114. 


DISTRIBUIÇÃO MULTINOMIAL 


4.26. Uma caixa contém 5 bolas vermelhas, 4 brancas e 3 azuis. Extrai-se uma bola 
ao acaso, anota-se a cor, repondo-se em seguida a bola na caixa. Determine a 
probabilidade de que, de 6 bolas assim escolhidas, 3 sejam vermelhas, 2 


brancas e 1 azul. 


Método 1 (pela fórmula) 5 
P (vermelha em qualquer extração) = E 


P (branca em 


P (azul em qui 


xtracüc! 


quer extração) = o 


188 PROBABILIDADE E ESTATISTICA 


Entáo, P (3 vermelhas, 2 brancas, 1 azul) 


a QAI а Ив „ бш. 
= 312111112 12 12 |. 5184 


A probabilidade de escolher uma bola vermelha é 5/12, Entáo a probabilidade de 
escolher três bolas vermelhas é (5/12)%. Analogamente, a probabilidade de escolher duas 
brancas é (4/12)? e a probabilidade de escolher 1 azul é (3/12)!. Assim, a probabilidade 
de escolher 3 vermelhas, 2 brancas e 1 azul, nessa ordem, é 5 bi ayay 

(a) 8) Gs) 
Mas a mesma escolha pode ocorrer em diversas ordens, cujo nümero é 
6! 
812111! 
como vimos no Cap. 1. Entáo a probabilidade procurada é 


атта) (8) (6) 


A probabilidade desejada é o termo р?рё p, по desenvolvimento multinomial 
de (р, + р + рь) onde p, = 5/12, p, = 4/12, рь 3/12. Efetuandose o desen- 
volvimento, obtem-se o resultado acima. 


Método 2. 


Método 3. 


A DISTRIBUIÇÃO HIPERGEOMETRICA 


4.27. Uma caixa contém 6 fichas azuis e 4 vermelhas. Um experimento consiste em 
extrair uma ficha, anotar sua cor, não repondo a ficha na caixa. Determine a 
probabilidade de serem extraídas 3 fichas azuis em 5 extrações. 


Método 1. 


O número de escolhas de 3 fichas azuis dentre 6 é (5) O número de escolhas 
das restantes 2 fichas dentre as 4 vermelhas é m Assim, o nümero de amostras 
distintas contendo 3 fichas azuis e 2 vermelhas 6 ( 6 \( AV 

\3/42/ 
Mas о número total de escolhas possíveis de 5 fichas dentre as 10 (6 +4) da caixa 


‚ [10 " : n 
é ( 5 ) Assim, a probabilidade procurada é 
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Método 2 (aplicando a fórmula) 


Temos b = 6, r —4, n —5, x = 3. Então, por (19), pág. 163), a probabilidade é 


PX=3) = 9/8) 


A DISTRIBUIÇÃO UNIFORME 


4.28. Mostre que a média e a variância da distribuição uniforme (pág. 163) são 
dadas respectivamente por (а) „= ¿(a +b), (b) о = (b—a)?. 


Š = adt _ e Po bB- _ a+b 
(e) “= He) = f bea ^ ppa) = o B 
(b) Temos 
22 х e | b? — аз b? + ab + a? 
2 = E == = 2. M RN So RUE. A 
B f Des Sb-dl 7 360 3 
Então a variância é 
EX] = Е(Х2) — и 
b? + ab + а? ar _ 1 ” 
= 3 -( £s) =ош 


A DISTRIBUIÇÃO DE CAUCHY 


4.29. Mostre que (a) a função geratriz de momentos de uma v.a. com distribuição 
de Cauchy não existe, mas que (b) a função característica existe. 


(a) A função geratriz de momentos de X é 


Е(ех) = © f T „ы 
mJ... Wd al 


que nào existe no caso de 2 real. Com efeito, basta notar, p. €x., que, se x >Q 
t0 


R 

kd 

S 
& 
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de modo que 


e a integral à direita diverge. 
(b) A função característica de X é 


id dax 
Ele = E f NL 
(eieX) TJ, ra des 


; ге 
C08 ur ai “sen Cox 

E AM de + z3 de 

FER @ т ds aid od 


_ 2a (^ coser 
=% = zde 
т Jo Pte 


onde utilizaremos o fato de que os integrandos da penúltima linha são funções par 
е ímpar respectivamente. Pode-se ver que a última integral existe e é iguala e-99 . 
(v. Problema 4.159). 


4.30. Seja o uma variável aleatória distribuída uniformemente no intervalo 
" п 

-5 <0< zo 

Prove que X=atano, a > 0, tem distribuição de Cauchy em 


—o < e < o, 
A função de densidade de © é 1 
+ E E E 
fe = = 2995 
Considerando a transformação ж = a tan 6 temos 
= apt йй a &._. 
а tro, E de pepa 


Então, pelo Teorema 2-3, pág. 63, a função de densidade de X é dada por 


às | 
atm) = roli = em 


que é a distribuição de Cauchy. 
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A DISTRIBUIÇÃO GAMA 


4.31. Mostre que a média e a variância da distribuição gama são dadas por 
(a) пк = а8, (b) &? = ap. 


a-ig- zih БЕЕН 
: -pegs 
) бега) JA J, Bra 
Fazendo 2/8 — t temos 


_ ES ("asap LB = 
es En а = let) = ад 


ga-le IB gatie- zB 


b Е(Х?) = = E sas Ruin 
(b) (x2) v5 М8 Í EN de 


Fazendo 2/8 = t temos 


E(X?) = dep], "tetas 
- оте) = e+ i)a 


pois T(e+2) = (a--1)T(a--1) = (a+ Darío). Assim 
ot = HR) = pat i)a- (ap? = ap? 


A DISTRIBUIÇÃO BETA 


4.32. Determine a média da distribuição beta. 


^. A 1 
в = ER = ora), te Aedo 
0 
i j 
I 


Ti+ B) ría 1) r(B) 
T(o)T(B) Madi + gi 

Tet) MATA). a 
Pe) (8) (a +) Pa =p) ^ a+B 


4.33. Determine a variância da distribuição beta. 


O segundo momento em relação à origem é 
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з 1 
0 
| : 
= rete aa — 8-1 de 
0 


Pía + B) Tla + 2) r(£) 

Tío) MB) Ma F 2+ B) 

Ila +B) (а + De Pla) F(8) 
Tla) (B) (a FB+ Día + B) (a + B) 


ala + 1) 
(a+ Be + 2+1) 


Então, usando o Problema 4.32, a variância é 
а = БЖ) [EO = mo (x) 
ТЕКЕГЕ ЕТУ 
A DISTRIBUIÇÃO QUI-QUADRADO 


4.34, Mostre que a função geratriz de momentos de uma variável aleatória X com 
distribuição qui-quadrado com v graus de liberdade é M(t)= (1=2t) 8, 


1 ч аууз > 
M(t) = E(e") = FATO Í, etz yv —2)/2 9—2/2 dg 
1 Е 9 
— — (v —2)/2 e- (1720/2 
2-2 T (4/2) f qe. 5 de 


Fazendo (1 — 2t)w/2 — w na última integral, vem 


1 ef my NOM _ йш 
Mg а a, (8%) Cia 


— 9t)-vi2 2d 
a if ud deu da =  (1—80-" 
o 


4.35. Sejam X, e X, variáveis aleatórias independentes com distribuição qui- 
quadrado com v, e v, graus de liberdade respectivamente. (a) Mostre que a 
função geratriz de momentos de Z = Xi X» é (1—21) '*'27 e assim 
(b) mostre que Z tem distribuição qui-quadrado com v; + v, graus de liber- 
dade. 


(a) A função geratriz de momentos de Z = X, + X, é 


Mit) 


4.36. 


4.37. 


4.38. 
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= [ехо] = BE = (1 2y 2 — 207? 
= (1-2 "mm 
usando o Problema 4.34. 


(b) Do Problema 4.34 vemos que uma distribuigáo cuja fungáo geratriz de momentos 
é (1—2f) C:*"9/? é a distribuição qui-quadrado com v, +», graus de liberda- 
de. E esta deve ser a distribuição de Z, de acordo com o Teorema 3-12, pág. 115. 

Generalizando os resultados acima, obtemos uma prova do Teorema 44, pág. 
166. 


Seja X uma v.a. distribuída normalmente com média O e variáncia 1. Mostre 
que X? tem distribuição qui-quadrado com 1 grau de liberdade. 


Desejamos determinar a distribuição de Y = А? dada uma distribuição normal 
padronizada para X. Como a correspondência entre X e Y não é um-a-um, não podemos 
aplicar o Teorema 2-3 tal como ele se apresenta; procederemos, entretanto, como segue. 

Para y <0 é claro que P(Y « y) = 0, Para y > 0, temos 


PY <a) = Р(Х<у) = Р(-уу<Х<+ үу) 


LN з (vv 
da = —=— f еа dy 
mi. V2r Jo 


onde no último estágio utilizamos o fato de que a função de densidade normal padroni- 
zada é par. Fazendo a mudança de variável x — E na integral final, obtemos 


1 y 
PY <u) = эсе | EU dt 
y2z do 


Mas esta é uma distribuição qui-quadrado com 1 grau de liberdade, como se pode ver 
pondo v=1 em (39), pág. 165, e usando o fato que T($) = 


Prove o Teorema 4-3, pág. 116, para v = 2. 


Pelo Problema 4.36, vemos que se X, o X, são normalmente distribuídas com 
média 0 e variância 1, então жї е ха têm distribuição qui-quadrado com 1 grau de 
liberdade cada. Então, pelo Problema 4.35(b), vemos que Z = X, s +хў tem distribui- 
ção qui-quadrado com 1 + 1 =2 graus de liberdade se X, e X, forem ndependentes. 
O resultado geral para todos os inteiros positivos » decorre analogamente. (v. Problema 
4.150). 


A Fig. 4-18 exibe o gráfico da distribuição qui-quadrado com 5 graus de 
liberdade. (Cf. observações sobre notação na pág. 166) Determine os valores 
Xp X? рага os quais 

(a) a área sombreada à direita = 0,05. 
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(b) a área total sombreada = 0,05. 
(c) a área sombreada á esquerda = 0,10. 
(d) a área sombreada à direita = 0,01. 


Fig. 4-18 


xi x 


(а) Se a área sombreada à direita é 0,05, então a área à esquerda de x é (1 — 0,05) = | 
=0,95 e xi representa o 959 percentil, 
Compulsando a Tábua do Apéndice E, siga a coluna encabeçada por v até atingir 
o número 5. Caminhe cntão paia a direita até a coluna encabeçada por as: O resul- 
tado, 11,1, é o valor procurado de x?. 


(b) Como a distribuição não é simétrica, existem muitos valores para os quais a área total 
sombreada é 0,05. P. ex., a área sombreada à direita poderia ser 0,04. enquanto que a 
área sombreada à esquerda seria 0,01. Costuma-se, entretanto — a menos que se 
especifique o contrário — escolher as duas áreas iguais. Neste caso, então, cada área 
será igual a 0,025. 

Se a área sombreada à direita é 0,025, a área à esquerda é 1 — 0,025 = 0,975 e 
xi representa o 97,59 percentil, Хд эте, igual a 12,8 (cf. Apêndice E). 

Analogamente, se a árca sombrcada à esquerda é 0,025, a área à esquerda de 
xi é0,025 e x representa o 2,59 percentil, pis, que é igual a 0,831. 

Assim, os valores são 0,831 e 12,8. 


(c) Se a área sombreada á esquerda é 0,10, х? representa о 100 percentil, хао» que é 
igual a 1,61. 


(d)Se a área sombreada à direita é 0,01, a área à esquerda de X é 0,99 e representa o 
990 percentil, Ход, quc € igual a 15,1. 


4.39. Determine os valores de X^ para os quais a área da cauda direita da distribui- 
ção X é 0,05, se o número de graus de liberdade, у, é igual a (а) 15, (b) 21, 
(c) 50. 


2 
Compulsando a Tábua do Apéndice E, encontramos, na coluna encabeçada por Xo,05 
os valores: (a) 25,0, correspondente a v = 15; (b) 32,7 correspondente a v = 21;(0) 67,5, 
X? 0,05 correspondente a v =50. 


4.40. Determine a mediana de X correspondente a (a) 9, (b) 28 e (c) 40 graus de 
liberdade. 


Utilizando a Tábua do Apêndice E, encontramos na coluna encabeçada por 
„50 (pois a mediana é o 50º percentil) os valores: (а) 8,34, correspondente a y —9; 
(b) 27,3, correspondente a у = 28; (c) 39,3, correspondente ау = 40. 
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É interessante notar que os valores medianos são quase iguais ao número de 
graus de liberdade. De fato, para » > 10 esses valores são iguais a y — 0,7, como se 
pode constatar pela tábua. 


4.41. Determine Xos para (а) v = 50 e (b) v = 100 graus de liberdade, 


Para v2» 30, podemos usar o fato que (V 2x* — V£r — 1) tem distribuição 
muito aproximadamente normal com média zero e variância 1. Então, se zp é o 100p9 
percentil da distribuição normal padronizada, podemos escrever, com alto grau de 


aproximação, 
ou үх = a + М1 
donde = 
№ = de + М2 1) 


(a) Se += 50,0895 1Gops- VEO) — 1)? = 101,04 + V99)? = 69,2, resultado 
que concorda muito bem com о valor 67,5 dado no Apéndice E. 


(B)Se» = 100895 1/Z095 + V2(100)—1): = 1(1,64 + 199 ? = 124,0(valor 
exato = 124,3). 
DISTRIBUIÇÃO ; DE STUDENT 


4.42. Prove o Teorema 4-6, página 167. 


Como Y é distribuída normalmente com média O e variância 1, sua função de 


densidade é M 
a) extra 
Como Z tem distribuição qui-quadrado com y graus de liberdade, sua função de densida- 
de é 
i Heat? 
e pup 4 d аз 


E como Y e Z são independentes, sua função de densidade conjunta é o produto de (1) 


(2), isto é 
z 1 


— 00000-1 tar 
М? 2/2 T (1/2) 


para —e < y < to, 2>0, 
A função de distribuição de T = Y/VZ/» é 


F(a) = P(T<«) = P(Y«avZlh) 


ага 
E Es — g/22-1e— Q^ +2202 dy de 
27 21/21 (9/2) 


R 


— NAR ЫРЫ 
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onde a integração se faz sobre a região R do plano yz para a qual ус 2VY2/r. 
Primeiro fixamos z e integramos em relação a y de — o а gyz/». Em seguida integra- 
mos em relação a z de 0 aco . Temos assim 

dl 


Ж} = е f omc] (ea 
У 2012192) ), 7" ш | ea pus 


Fazendo y = «uVz/v na integral entre colchetes, obtemos 
Fü) = == S 
V2z 2»/2 (0/2) «so 


i " 
(0 229021 (0/2) І =- 


2 
Fazendo w — Зе + £) podemos escrever 
" 


ap(v—1)/2e—w 


= > , puw+1)y2 d ] 
Fu) Уват)" MEM Aran dw |du 


1 


du 
AS 


conforme desejado. 


4.43. A Fig. 4-19 exibe o gráfico da distribuição г de Student com 9 graus de 
liberdade. Determine o valor de f, para o qual 
(a) a área sombreada à direita é 0,05. 
(b) a área total sombreada é 0,05. 
(с) а área total não-sombreada é 0,99. 
(d) a área sombreada à esquerda é 0,01. 
(e) a área à esquerda de г, é 0,90. 


Fig. 4-19 


(a) Se a área sombreada à direita é 0,05, então a área à esquerda de г, é 1 — 0,05 = 
=0,95 e t, representa о 959 percentil, 

Compulsando a tábua do Apêndice D, percorremos a coluna encabeçada por v até 
a entrada 9. Caminhamos em seguida para a direita até a coluna encabeçada por 
10,95. O resultado, 1,83, é o valor procurado de f. 

(b) Se a área total sombreada é 0,05, então a área sombreada à direita é 0,025, por 
simetria. Assim, a área à esquerda de г, é 1 — 0,025 =0,975 e f, representa о 
97,5º percentil, £9.75. No Apéndice D encontramos 2,26 para o valor procurado 
det. 


— 
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(c) Se a área total não-sombreada é 0,99, então a área total sombreada é 0,01, e a área 
sombreada à direita é 0,005. Na tábua encontramos fo99s= 8.25. 


(d) Se a área sombreada à esquerda é 0,01, entáo, por simetria, a área sombreada à 
direita é 0,01. Pela tábua, to,99= 2.82. Assim, o valor de ! para о qual a área 
sombreada à esquerda é 0,01, é - 2,82. 


(e) Se а área à esquerda бег, é 0,90, então г, corresponde ао 900 percentil, Торо, 
que é igual a 1,38, conforme a tábua, 


4.44. Determine os valores de / para os quais a área da cauda direita da distribuição 
t é 0,05, se o número de graus de liberdade v é igual a (a) 16, (b) 27, (c) 200. 


No Apêndice D, encontramos na coluna encabeçada por fos os valores: (a) 1,75 
correspondente а v = 16; (b) 1,70, correspondente a v = 27; (с) 1,645, correspondente а 
v = 200. (Este último é o valor que teríamos obtido utilizando a curva normal. No 
Apéndice B este valor corresponde à entrada na última linha marcada co.) 


A DISTRIBUIÇÃO F 
4.45. Prove o Teorema 4-7. 


A função de densidade conjunta de V, e V, é dada por 


1 v2 3 mIn 
Hu, va) = dem 5 aqui ыы —— m 1g-v2 
Ма" р(,1/8) 22D (1/2) 
= Ld A A UNA G8 92) 
SADA DTD 2 
gn * р /2) T(ro/2) 
Se v, 2 0, v, > 0 е0 em caso contrário. Façamos a transformação 
wr PV) күш 
и = ===, A ou т — ——, б = 
rva s ”a 
Então o jacobiano é 
O(v, v) _ |9v1/du дод vwo түн» _ nw 
aln, w) | äva/ñu avaló Е 0 1 r2 
Denotando a densidade como função de u e w por g(u, w), temos 
: 099—1 Я 
1 ССА (04/3) OLA (u/n w72) #1 
glu, w) а; - aps e = 
gr? ре Иа) Tr 2)N Te. / А 


se u > 0, w > 0 e 0 em caso contrário. 


A fungáo de densidade (marginal) de U pode agora ser encontrada, integrando-se 
em relação a w de 0 a оо, isto ё, 


н 
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щи) = 
se и> 0 e 0s “SO. Mas de 15., Apéndice A, 
f rd ear dao = r) 
“0 а 
Temos assim 


А 24 rm 
aa DA y Е 


ми) = 


UN JO vm 


qto! ps2) r(y/2) EC Г 


а) 


( 2 / мз DA (gs 


ju 72 


seu 70 e 0 se и < 0, queéo resultado procurado. 


сун) 


Lu) 


4.46. Prove que a distribuição F é unimodal para o valor C 
v2. 


A moda loca o valor máximo da função de densidade. A menos de uma constante, 
a função de densidade da distribuição Fé 


GU ug ey uy Do a 


Se existe máximo relativo, este ocorrerá onde a derivada é zero, isto é, 


М (т +) 2 
ES NS ECN A | a ertet 1 
y 


= 0 Dividindo рог 4/22 —2(03 + рди) RAIL, и * 0, encontramos 


n эр + „у — 2% » 
eee maii) ea ms - (гы) 


Aplicando o teste da derivada segunda, pode-se mostrar que se trata efetivamente de um 
máximo. 


4.47, Utilizando a Tábua da distribuigáo F, Apéndice F, determine (a) Fogs, 10,15 
(b) Fogo, 15,9. (С) Fons, в, зох (D Кор, 15,9: 


= 15, encontramos Fos, 10,15 = 3,80. 


(a) Do Apéndice F, com » = 10, vo 
y, encontramos Fogo,15,9 = 4,96. 


(b) Do Apêndice Е, com » = 15, rp 
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(c) Pelo Teorema 4-8, pág. 168, Fops, gm = Sa = 9925 
10,95, 30, 8 
(d) Pelo Teorema 48, pág. 168, Рур, 15,9 = -——— = 0257 
Fo99, 9, 15 " 


RELACÓES ENTRE AS DISTRIBUICOES F, Y Et 
4.48. Verifique que (2) Кә; = 8,975, (P) Fogo = têpos. 


(a) Compare os valores da primeira coluna da tábua de Fos no Apéndice Е com os 
valores da distribuição Ё sob ѓо,этѕ. Vê-se que 


161 = (12,702, 18,5 = (4802, 101 = (3,18%, 7,11 = (2,78)2, ete. 


(b) Compare os valores da primeira coluna da tábua de Fpy9 no Apéndice F com os 
da distribuição t encabeçados por to,995. Vê-se que 


4050 = (63,662, 98,5 = (9,922, 841 = (5,84%, 21,2 = (4,602, ete. 
4.49. Prove o Teorema 4-9, pág. 168, que pode enunciar-se abreviadamente como 
Fi-, = ti (p/3) 

e generalize, assim, os resultados do Problema 4.48. 


» = » na função de densidade para a distribuição F [(45), pág. 


Seja м =1, r 
167]. 
Então 
r +1) 
(а ) 
jo) = В 2 py V2 (p + u) 7 0/2 
diig? 
(л) 
(222) 
9 f —бе+1!/2 
= Ё d it Е! | E) 
ps „ү B »j 
vs TI 3) 


v 


yr 
n= ) Žž Nena 
= un +£) 


para u > 0, e f (u) =0 para u < 0. Ora, pela definição de percentil, Еу, é о número 
tal que P(U &F, ,) = i- P. Assim 
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4.50. 


384 = 22, 300 = 


iv) 
ini 


Na integral, Pen a mudança de variável t = Vw: 


MOT к» s 


Comparando com (42), pág. 166, vemos que o membro esquerdo da ültima equacao é 
iguala 


Qoo na 
) du = 1-р 


2« P(0 c T<+VF,-p) 


onde T é uma variável aleatória com distribuição + de Student com » graus de liberdade. 
Assim, 


| 


= PO<TS <E 5) 
= p(reoyF,. - PUSO 


= Arain – 9 


| 


onde nos valemos da simetria da distribuição f. Resolvendo, temos 


BIS Фу р) = T= 5 


Mas, por definição, fy- („зу ÉO número tal que P(T Lt qa) = 1— a e 


tal número é determinado de maneira única, pois a função de densidade da distribuição 
t é estritamente positiva. Portanto, 


AVE. I, = tomo 0% Ely Lam 
cqd. 


Verifique o Teorema 4-10, pág. 168, para (a) p =0,95 e (b) p = 0,99. 


(a) Compare os elementos da última linha da tábua de Fos no Apêndice F (correspon- 
dente a r= ^ com os dados encabeçados por X095 no Apêndice E. Vê-se que 


9,49 11,1 


2302 O, 22177, ele 


7,81 
2,60 = 737 


o que completa a verificação. 


(b) Compare os elementos da última linha da tábua de Foss no Apéndice F (correspon- 
dente a го = = )com os dados encabegados por Хө no Apéndice E. Vé-se que 
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бз 
e, 


o que completa a verificação. 
A prova geral do Teorema 4-10 decorre fazendo-se r, >= na distribuição F, 
pág. 167 (v. Problema 4.145). 


A DISTRIBUIÇÃO NORMAL BIVARIADA 


4.51. 


Sejam X e Y variáveis aleatórias cuja função de densidade conjunta é a distri- 
buição normal bivariada. Mostre que X e Y são independentes, se e somente 
se, seu coeficiente de correlação é zero. 


Se o coeficiente de correlação p é igual a 0, a função de densidade normal bivaria- 


da (49), pág. 168 se escreve 
— e- iuti 
сМ 


e como se trata do produto de uma função de x somente por uma função de y somente, 
para todos os valores de x e y, segue-se que Xe Y são independentes. 

Reciprocamente, se X e Y são independentes, f (x, y), dada por (49), deve, para 
todo x e y, ser o produto de uma função de x somente por uma função de y somente. 
E isto é possível só se p 0, 


Fis, u) 


DISTRIBUIÇÕES DIVERSAS 


4.52. 


Determine a probabilidade de que, em uma seqüéncia de jogadas de um dado, 
o 3 apareça pela primeira vez na quinta jogada. 


Método 1. 


A probabilidade de não obter 3 na 12 jogada é 5/6. Analogamente, a probabili- 
dade de não obter 3 na 22 jogada é 5/6, etc. Então a probabilidade de não obter 3 nas 
4 primeiras jogadas é (5/6115/6)(5/6)(5/6) = (5/6y1. E como a probabilidade de obter 
3 na 5? jogada é 1/6, segue-se que a probabilidade procurada é 


EYG) = 


Método 2 (aplicando a fórmula) 


Utilizando a distribuição geométrica, pág. 169, com p=1/6, q=5/6, x=5 
vemos que a probabilidade procurada é p = 1/6, 4 = 5/6, 2=5 


(1 BV 025 
los) + 7716 


= "a 
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4.53. Verifique as expressões (a) da média, (b) da variância da distribuição de 
Weibull, pág. 169. " 
E abx? e—a” da 
0 


(a) y = E(X) 
ab (^fw 1 
UN e-ulaa/n-i 
ai Jo (3. ¿e du 
= ain ff ulbe-u du 
o 


= ems + 5) 


onde fizemos a substituição u —À para calcular a integral. 


" 
(b) EX) = f ERES iie 
0 
ав ACIE 3 
= йж), (5) Е “чаъ i dy 


= a72% f u3/0 e—* du 
“0 


= anos + 2) 
Então 
2 = E(X- 4? 


EX) — e 


69-09] 


[i 


PROBLEMAS DIVERSOS 


4.54. A probabilidade de um estudante que entra na Universidade se formar é 0,4. 
Determine a probabilidade de que, dentre 5 estudantes, (a) nenhum, (5) um, 
(c) ao menos um se forme. 


(a) P (nenhum se formar) = 5Cp(0,4)%(0,6)% = 0,07776, ou aprox. 0,08 
(b) P (um se formar) = ,C,(0,4)1(0,6)! = 0,2592, ou aprox. 0,26 
(c) P (ao menos um se formar) = 1 — P (nenhum se formar) = 0,92224, ou aprox. 0,92. 


4.55. Qual a probabilidade de obter o total 9 (a) duas vezes, (b) ao menos duas ve- 
zes, em seis jogadas de um par de dados? 


4.56. 


4.57. 
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Como cada uma das seis possibilidades do primeiro dado pode associar-se a cada 
uma das seis possibilidades do segundo dado, há 6.6=36 possibilidades para os dois 
dados jogados em conjunto, a saber: 1 no 19 e 1 no segundo, 1 no primeiro e 2 no 
segundo, etc., denotados por (1, 1), (1, 2), etc. 

Dessas 36 maneiras, todas igualmente prováveis, o total 9 ocorre em 4 casos: 
(3,6), (4,5), (5, 4), (6, 3). Então a probabilidade de ocorrência do total 9 na jogada de 
um par de dados é p 24/36 21/9, e a probabilidade de não obter 9 na jogada de um par 
de dados é q = 1 — p =8/9. 


йы 61,440 
— 531.441 


2 
(a) P (dois 9 em seis jogadas — afi) 6 = 


(БУР (ao menos dois 9) = P (dois 9) + P (três 9) + P (quatro 9) + P (cinco 9) + 
+P (seis 9) 


ANNAN 7*0) 


_ 61.440 & 10.240 d 960 + 48 + 1 — 72.689 
531.441 531441 531441 ' 531.441 531.441 531.441 


Outro Método. 


Р (ao monos dois 9) = 1 — Р (zero9) — P(um9) 


0 6 X 5 
— 1\ {в\* _ ( 11/81 _ 72,689 
a ($) 8) e(t) (5) 7 531,441 


Se а probabilidade de ocorrência de uma peça defeituosa é 0,1, determine 
(a) a média e (b) o desvio padrão da distribuição de peças defeituosas em um 
total de 100. 


(a) Média = np =400 (0,1), i.c., podemos esperar 40 peças defeituosas 
(b) Variáncia = про = 400(0,10)0,9)= 36. Logo, o desvio padrão é 436 =6. 


Determine os coeficientes (a) de assimetria, (5) de kurtosis da distribuição do 
Problema 4.56. 
; ЧИРЕ a-p | 09-01 _ " 
(a) Coeficiente de assimetria = 2% = -"——— 0,133 
Vapa б 


Como o coeficiente é positivo, а distribuição é assimétrica à direita. 


y 1=6pg _ y, 0 80.009 


(b) Coeficiente de kurtosis = 3 
пра 36 


3,01 


O “pico” é ligeiramente mais acentuado do que no caso da distribuição normal. 
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4.58 Em um teste de biologia, atribuem-se as notas 0, 1, 2, ..., 10, de acordo com o 
número de questões respondidas corretamente, em um total de 10. A nota 
média foi 6,7 e o desvio padrão foi 1,2. Admitindo a distribuição normal das 
notas, determine (a) a percentagem de estudantes com 6 pontos, (b) a maior 
nota dentre os 10% mais baixos da classe, (c) a menor nota dentre os 10% 
mais altos da classe. 


(a) Para aplicar a distribuição normal a dados discretos, é necessário tratá-los como se 
fossem contínuos. Assim é que um escore de 6 pontos é considerado como 5,5 a 6,5. 
(v. Fig. 4-20). 


5,5 em unidades padronizadas = (5,5 — 6,7)/1,2 = —1,0 
6,5 em unidades padronizadas = (6,5 — 6,7)/1,2 —0,47 
Proporção procurada = área entre z =- 1 ez —0,17 = (área entre z =- 1 ez —0) — 
— (área entre z =- 0,17 ez = 0) 20,3413 — 0,0675 20,2738 = 27%. 


“a ou 
Fig. 4-20 Fig. 4-21 
(b)Seja «w, a nota máxima procurada e 2, seu equivalente em unidades padronizadas. 
Pela Fig. 4-21, a área à esquerda de 21 é 10%=0,10; logo 
area entre z; e0=0,40 
e 2 = —1,28 , muito aproximadamente. 


Então, z, = (x, — 6.7)/1,2 = —1,28 e x, = 5,2 0uS, arredondado. 


(с) Seja x, a nota mínima procurada e 2» а mesma nota em unidades padronizadas. 
De (b), por simetria, z> = 1,28, Então (2; — 6,7)/1,2 = 1,28, em, = 8,2 28. 


4.59, Utiliza-se um contador Geiger para contar a chegada de partículas radioativas. 
Determine a probabilidade de que, no tempo 1, nenhuma partícula seja 
detectada. 

Consideremos a Fig. 4-22 representando o eixo do tempo, com 0 como origem. 
A probabilidade de uma partícula num pequeno intervalo At é proporcional a Al €, 
assim, pode ser representada por A M. А probabilidade de uma contagem zero no 
tempo Аг é 1 — A At. 

Mais precisamente, há outros termos envolvendo (At)? e ordens superiores, mas 
estes são desprezíveis se At é pequeno. 

Seja Py(t) a probabilidade de contagem zero no tempo f. Então, P, (t +At)éa 
probabilidade de contagem zero no tempo t- At. Supondo-se que as ocorrências de 
partículas sejam eventos independentes, a probabilidade de contagem zero no tempo 


t At 


[^ Fig. 4-22 


4.60. 
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¿+ At é o produto da probabilidade de contagem zero no tempo f pela probabilidade 
de contagem zero no tempo Af. Portanto, desprezando os termos que envolvam (At)? 


ou termos de ordem superior, 
u) Pitt at) = Po(t)[L— 241] 


De (1) obtemos 


2 i Bon So 
' A. at MS 
ie. 
dPy aPy 

5 — = АР = E uod 
(3) dt AP ou Po A dt 
Resolvendo (3) por integração, obtemos 

InPy = —M ce; ou Poli) = eet 


Para determinar c, note-se quese t=0, Po(D) = c ёа probabilidade de contagem 
zero no tempo zero, que, naturalmente, é1. Assim c = 1 e a probabilidade é 


(4) Pol) = em 


Em referência ao Problema 4.59, determine a probabilidade de uma contagem 
exatamente igual a 1 no tempo 7 


Seja P,(!) a probabilidade de contagem um no tempo г, de forma que P, (t + At) 
é a probabilidade de contagem um no tempo t + Ar. Teremos então a contagem um no 
tempo £ + At nas duas seguintes maneiras, mutuamente exclusivas: 
(Gi) 1 no tempos e Ono tempo ât 
(i) 0 по tempo te 1 no tempo At 

A probabilidade de (i) EP — à At). 

A probabilidade de (ii) é Pa (£)^ At. 

Assim, a menos de termos envolvendo (At)? ou de ordem superior, 


a) PQ(t4- At) = Р|(®)(1—ХА®) + Polt) At 


Esta expressão pode ser escrita 
” Pitta — Руб 
e AMA O = м. 


Tomando o limite quando Лг >0 e utilizando a expressão de Ро (0 obtida no Pro- 
blema 4.59, esta última expressão se torna 


ар 
(3) e = ле-№ – АР! 
ou 
de 
(4) т AP, = Хет 


Multiplicando рог eM vem 


d 
(5) (MP) = А 
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donde, por integração, 
(6) А Pitt) = Me M+ сое 


Se += 0, Р, (0) é а probabilidade de contagem um no tempo 0, que é zero. Levando 
em (6) este resultado, obtemos сә = 0. Assim 
(7 Pit) = MeM 


Prosseguindo desta forma, pode-se mostrar que a probabilidade de exatamente n contagens 
no tempo £ é dada por 


(8) Palt) = 


que é a distribuição de Poisson. 


(хте 
n! 


Problemas Suplementares 


A DISTRIBUIÇÃO BINOMIAL (DE BERNOULLI) 

4.61. Determine a probabilidade de que, em seis jogadas de uma moeda, apareçam (a) 0, (b) 1, 
(с) 2, (d) 3, (е) 4, (1) 5, (£) 6 caras. 

4.62. Determine a probabilidade de (a) 2 ou mais caras, (b) menos de 4 caras, na jogada de seis 
moedas. 

4.63. Se X denota o número de caras na jogada de 4 moedas, determine (2) P(X = 3), 
(b) Р(Х < 2), (e) P(X&2), (d) PA < X«3). 

4.64. De 800 famílias com 5 filhos, quantas poderíamos esperar com (a) 3 meninos, (b) 5 
meninas, (с) 2 ou 3 meninos? (Admita-se probabilidade igual para menino е menina.) 

4.65. Determine a probabilidade de obter o total 11 (a) uma vez, (b) duas vezes, em duas 
jogadas de um par de dados. 

- 4.66. Qual a probabilidade de obter 9 exatamente uma vez em três jogadas de um par de 
dados? 

4.67. Determine a probabilidade de acertar pelo menos 6 vezes em um exame do tipo “verda- 
deiro-falso” com 10 questões. 

4.68, Um corretor de seguros vende apólices de seguro a 5 homens, todos de mesma idade e em 
boas condições de saúde, De acordo com as tábuas atuariais, a probabilidade de um 
homem dessa idade estar vivo daqui a 30 anos ё $. Determine а probabilidade de que, 
daqui a 30, (a) todos os 5 estejam vivos, (b) ao menos 3 estejam vivos, (c) só dois estejam 
vivos, (d) ao menos um esteja vivo. 

4.69. Calcule (a) a média, (b) o desvio padrão, (c) o coeficiente de assimetria, (d) o coeficiente 


de kurtosis para uma distribuição binomial com p = 0,7, n = 60. Interprete os resultados. 


4.72. 
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. Mostre que, se uma distribuição binomial com n = 100 é simétrica, seu coeficiente de 


kurtosis é 2,9. 


. Calcule (a) E (e — п) f(2) e (b) 2 (z — u)t f(x) para a distribuição binomial. 


Demonstre as fórmulas da pág. 156 para os coeficientes de assimetria e de kurtosis. 


A DISTRIBUIÇÃO NORMAL 


4.73. 


4,74, 


4.75. 


4.76. 


4.77. 


4.78. 


4-79. 


4,80, 


4.81. 


4.82, 


4.83. 


4.84. 


Em um exame, a média foi 78 e o desvio padrão 10. (а) Determine os escores padro- 
nizados de dois estudantes cujas notas foram 93 e 62. (b) Determine as notas de dois 
estudantes cujos escores padronizados foram —0,6 e 1,2. 


Determine (a) a média e (b) o desvio padrão de um exame em que as notas 70 e 88 
correspondem aos escores padronizados 0,6 e 1,4, respectivamente. 


Determine a área sob a curva normal entre (а) z = —1,20 e = 2,40, (b) z = 1,23 
х= 1,87, (0) = -—285e 2 = —0,50. 


Determine a área sob a curva normal (a) à esquerda de z =-1,78, (b) à esquerda de 
z=0,56, (c) à direita de 2=-1,45, (d) correspondente a z > 2,16, (e) correspondente a 
-0,80< z < 1,53, (f) à esquerda de z =-2,52 e à direita de z = 1,83. 


Se Z é normalmente distribuída com média 0 e variância 1, determino 
(a) P(ZZ —1,04), (b) Р(—1,96< Z < 1,96), (e) P(Z| zz 1). 
Determine os valores de z tais que (a) a área à direita de z é 0,2266, (b) a árca à esquerda 


de z é 0,0314, (c) a área entre -0,23 e z é 0,5722, (d) a área entre 1,15 e z é 0,0730, 
(e) a área entre-z e z é 0,9000. 


Determine z, se P(Z>2,) = 0,84. Z sendo distribuída normalmente com média 0 e 
variância 1. 


X sendo normalmente distribuída com média 5 e desvio padrão 2, determine P(X oi» 
Se as alturas de 300 estudantes acusam distribuição normal kom média 68,0” e desvio 
padrão 3,0”, quantos estudantes têm altura (a) superior а (02), (b) inferior ou igual а 


( 647, (c) entre 65" e 71”, inclusive, (d) igual a 68”, (Medidas tomadas com aproximação 


“de 1") cr A LA tor MT 
Se os diâmetros de um conjunto de mancais têm distribuição normal com média 0,6140” 
e desvio padráo 0,0025”, determine a porcentagem de mancais com diámetros (a) entre 
0,610" e 0,618" inclusive (5) superiores a 0,617”, (c) inferiores a 0,608”, «q iguais a 
0,615”. Y: 1 Odo Não jo 


A média de um exame final foi 72 e o desvio padrão 9. Aos primeiros 10% atribui-se o 
grau A. Qual a nota mínima que um estudante deve obter para ser classificado em A? 


Se um conjunto de medidas acusa uma distribuição normal, que percentagem dessas 


ERE 
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4.85. 


4.86. 


medidas difere da média (a) por mais de meio desvio padrão, (b) por menos de três 
quartos do desvio padrão? 


Seu éamédiae O &o desvio padrão de um conjunto de medidas normalmente distribuí- 
das, que percentagem de medidas (a) está no intervalo и = 20, (р) está fora do intervalo 
п 5 120, (c) ésuperiora п — 1,50? 


No Problema 4.85, determine a constante de a de modo que a percentagem dos casos 
(a) dentro do intervalo y = ас seja 75% (b) inferiores a u — «o seja 22% 


APROXIMAÇÃO NORMAL DA DISTRIBUIÇÃO BINOMIAL 


4.87. 


4.88. 


4.90, 


Determine a probabilidade de que 200 jogadas de uma moeda (2) resultem entre 80 e 
120 caras, inclusive, (Б) menos de 90 caras, (c) menos de 85 ou mais de 115 caras, (d) 
exatamente 100 caras. 


Determine a probabilidade de um estudante acertar (a) 12 ou mais questões em 20, 
(b) 24 ou mais questões cm 40, em um teste de tipo verdadeiro-ou-falso. 


. Uma máquina produz peças que acusam 10% de defeituosas. Determine a probabilidade 


de que, em uma amostra aleatória de 400 peças produzidas por essa máquina, (a) no má- 
ximo 30, (b) entre 30 e 50, (c) entre 35 e 45, (d) 55 ou mais, sejam defeituosas. 


Determine a probabilidade de obter mais de 25 “setes” em 100 jogadas de um par de 
dados. 


A DISTRIBUIÇÃO DE POISSON 


4.91. 


4.92. 


4.93. 


4.94. 


4.95. 


Se 3% das lâmpadas fabricadas por uma companhia são defeituosas, determine a probabi- 
lidade de que, em uma amostra de 100 lâmpadas, (a) 0, (Б) 1, (c) 2, (d) 3, (е) 4, (D 5 
sejam defeituosas. 


No Problema 4.91, determine a probabilidade de (a) mais de 5, (Б) entre 1 e 3, (c) no 
máximo 2 lámpadas serem defeituosas. 


Uma caixa contém uma ficha vermelha e sete brancas. Extrai-se uma ficha ao acaso e 
anota-se a cor, repondo-a na caixa e misturando as fichas. Utilizando (a) a distribuição 
binomial e (b) a aproximação de Poisson para a distribuição binomial, determine a pro- 
babilidade de que, em 8 extrações, apareçam exatamente 3 fichas vermelhas. 


De acordo com a Divisão de Estatística Vital do Departamento de Saúde dos Estados 
Unidos, a média anual de afogamentos acidentais nos Estados Unidos é 3,0 por 100.000 
indivíduos. Determine a probabilidade de que, em uma cidade com 200.000 habitantes, 
se verifiquem (а) 0, (b) 2, (e) 6, (d) 8, (e) entre 4 e 8, (f) menos de 3 afogamentos 
acidentais em um ano. 


Prove que, se X, e X, são variáveis de Poisson, independentes, com parámetros Xe 
A, entáo X, +X, tem distribuicio de Poisson com parámetro A, +2. (Sugestão: Use 
a função geratriz de momentos.) Generalize o resultado para o caso de л variáveis. 
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O TEOREMA DO LIMITE CENTRAL 


4.96. Prove o teorema do limite central no caso de X',, Xo, ... serem independentes e identi- 
camente distribuídas com distribuição de Poisson, (13), pág. 160. 


4.97. Prove o Teorema do Limite Central para as variáveis independentes 


1 prob. 1/2 
XQ = 
x 1-1 prob 1/2 
4.98. Prove o Teorema do Limite Central para as variáveis independentes 
т rob. 
ж = prob. p 
| n! prob. q 


onde q = 1 — р, generalizando, assim, o Problema 4.97. 


4.99. Explique por que náo se pode esperar que o Teorema do Limite Central seja válido no 
caso de X}, Хо, ... terem distribuição de Cauchy. 
1 
= ——— "e <x<+*w 
= a A 


DISTRIBUIÇÃO MULTINOMIAL 
4.100. Prove o resultado (17), página 162. 


4.101. Joga-se um dado seis vezes. Determine a probabilidade de ocorrência de (a) 1 “um”, 
2 “dois”, 3 “três”, (b) uma face de cada vez. 


4.102. Uma caixa contém um número muito grande de fichas vermelhas, brancas, azuis с 
amarelas, na proporção 4:3:2:1. Determine a probabilidade de que, em 10 extrações, 
(a) apareçam 4 vermelhas, 3 brancas, 2 azuis e 1 amarela; (b) 8 vermelhas e 2 amarelas. 


4.103, Determine a probabilidade de não aparecer 1, 2 ou 3 em 4 jogadas de um dado. 


A DISTRIBUIÇÃO HIPERGEOMÉTRICA 


4.104, Uma caixa contém 5 fichas vermelhas e 10 brancas. Extraídas 8 fichas, sem reposição, 
determine a probabilidade de aparecerem (a) 4 vermelhas, (b) todas brancas, (c) ao 
menos uma vermelha. 


4.105. Extraindo-se, sem reposição, 13 cartas de um baralho usual de 52 cartas, determine a 
probabilidade (a) de 6 serem figuras, (b) nehuma ser figura. 


4.106.De 60 candidatos a uma universidade, 40 são do leste. Escolhidos 20 candidatos ao 
acaso, determine a probabilidade de (a) 10, (b) no máximo 2 serem do leste. 


4.107. Use a aproximação binomial (18) ou (24) para fazer o Problema 4.106 e discuta o grau 
de exatidão obtido. 


4.108. Prove diretamente que (22), pág. 163, se reduz a (1), pág. 155, quando № o. 
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A DISTRIBUIÇÃO UNIFORME 


4.109. Seja X distribuída uniformemente em —2 <r<?2. Determine 
(а) Р(Х <1), (6) Р0Х—1| >). 
4.110. Determine a função geratriz de momentos da disiribuição uniforme. 


4.111. Determine (2) o terceiro, (b) o quarto momento em relação à média para a distribuição 
uniforme. 


4.312, Determine o coeficiente (a) de assimetria, (b) de kurtosis da distribuição uniforme. 


4.113.Se X e Y são independentes e distribuídas uniformemente no intervalo 0 < xS 1, 
determine р(х—у|> p. 


A DISTRIBUICÁO DE CAUCHY 


4.114. Seja X distribuída segundo Cauchy ((29), pág. 164), com a = 2. Determine 
(а) Р(Х < 2), (b) Р(Х? 212). А 


4.115.Prove que o intervalo semi-interquartil para a distribuição de Cauchy é a. Por que, neste 
caso, o intervalo semi-interquartil pode substituir o desvio padrão? 


4.116. Prove que se X, e X, são independentes e têm a mesma distribuição de Cauchy, sua 
média aritmética também tem essa distribuição. 


4.117. Generalize o resultado do Problema 4.116. 


4.118.Sejam X, e X4 independentes e normalmente distribuídas com média 0 c variância 1. 
Prove que Y = X,/X, tem distribuição de Cauchy. 


A DISTRIBUICAO GAMA 
4.119. Verifique que (31), pág. 164, é uma função de densidade. 


4.120. Uma variável aleatória X tem distribuição gama coma — 3, fi— 2. Determine 
(а) P(X x1), (b) PU SX <2). 


4.121. Determine os valores modais da distribuição gama. 


4.122. Verifique (a) a função geratriz de momentos e (b) a função característica da distribuição 
gama dada por (33), pág. 164. 
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A DISTRIRINICAO BETA 
4.123, Verifique que (34), pág. 165, é uma função de densidade. 


4.124. Uma variável aleatória X tem distribuição beta com « — 3, A = 2, Determine: 
P(X—-i1 212. 


4.125. Prove que a distribuição beta tem moda únicaem = = (« — 1)/(a + В — 2). 


A DISTRIBUIÇÃO QUI-QUADRADO 


4.126. Para uma distribuição qui-quadrado com 12 graus de liberdade, determine o valor de 
XÈ tal que (а) a área à direita de X? seja 0,05, (b) a área à esquerda de x? seja 0,99, 
(с) a área à direita de х2 seja 0,025. 


4.127. Determine os valores de X^ para os quais a área de cauda direita da distribuição № é 
0,05, se o número de graus de liberdade y é (a) 8, (b), 19, (c) 28, (d) 40. 


4.128. Faça o Problema 4.127 se a área da cauda direita é 0,01. 


4.129. (a) Determine x; e xi tais que a área sob a distribuição 1” correspondente ағ = 20 
entre xj e xà seja 0,095, admitindo áreas iguais à direitas de x? e a esquerda de 
Xi (b) Mostre que, sem a hipótese de igualdade de áreas feita em (a), os valores de 
xi c xl não são únicos. 


4.130.Se a variável U tem distribuição qui-quadrado com v =7, determine xi е x tais que 
(a) FU > x2) = 0,025, (b) P(U < x3) = 0,50, (e) Р(хї <U< x) = 0,90. 
4.131. Determine (0) x 6,05 - (0) xps у” = 150. 
А $ Bo 
4.132. Determine (а) x 925 (8) x 9 1 y! 250. 


4.133. Mostre que, para grandes valores dev, у + zy Y2v, dá uma boa aproximação de 
x» { zp sendo o 100p? percentil da distribuição normal padronizada). 


4.134. Prove que (а) F(x?) =», (b) Var G2) = 2r. 


A DISTRIBUIÇÃO + DE STUDENT ` 


4.135. Para uma distribuição de Student com 15 graus de liberdade, determine o valor de гү 
tal que (a) a área à direita de £, seja 0,01, (b) a área à esquerda de +, seja 0,95, (c) a área 
à direita de t; seja 0,10, (d) a área conjunta à direita de t, e à esquerda de —t, seja 0,01, 
(e) a área entre -t, et, seja 0,95, 


4.136. Determine os valores de £ para os quais a área da cauda direita da distribuição f seja 0,01, 
se o número de graus dc liberdade v é (a) 4, (b) 12, (c) 25, (d) 60, (e) 150. 
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4.137. Determine os valores de f; na distribuição de Student que satisfazem a cada uma das se- 
guintes condições: (a) a área entre —f; € fı é 0,90 e » = 25, (b) a área à esquerda de 
= 60,025 "= 20, (c) a área conjunta à direita de t; е à esquerda de —f, é 0,01 e 
v=5, (d)a área à direita de 1, é 0,55 > = 16. 


4.138. Se uma variável U tem distribuição de Student com » = 10, determine a constante c 
de modo que (a) P(U > o) = 0,05, (b) Р(—в <U <c) = 0,98, (0) P(U<e) 
= 0,20, (d) P(U 2c) = 0,90. 


4.139. Mostre que, para 1 grau de liberdade, a distribuição f se confunde com a distribuição de 
Cauchy. 


4.140. Prove que a variância da distribuição de Student, com v graus de liberdade, é 
»[(» — 2), v» 2. 


A DISTRIBUIÇÃO F 


4,141.Calcule: (а) Fo9s, 15,125 (b) Fogo, 120,603 (0) Fo,99, 60, 245 (d) Боді, 30,125 
(е) Fops, 9,20; (D Fopis,s- 


4.142, Verifique que a integral de u= 0 а оо da função de densidade (45), pág. 167, é igual a 1. 
(Sugestão: Faça Y = rgu/(v, + rau). ) 


4.143. Prove os resultados (46), pág. 167. 


4.144.Prove o Teorema 4-8, pág. 168, (Sugestão: Faça a transformação u = 1/2) 


RELAÇÕES ENTRE AS DISTRIBUIÇÕES QUI-QUADRADO, t E F 


4.145. Prove o Teorema 4-10, pág. 168. 


A DISTRIBUICÁO NORMAL BIVARIADA 


4.146. Sejam X e Y variáveis aleatórias com função de densidade conjunta dada por 
(ax? + 2bxy + су?) 2 
fx, у) = ke” onde a, b, c, К são constantes e b^ «ac. Verifique que 


essas constantes sáo as constantes dadas em (49), pág. 168. 


4.147.8e X e Y conjuntamente têm a distribuição bivariada (49), mostre que elas são marginal- 
mente distribuídas com variáncias о? € оў respectivamente. 
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PROBLEMAS DIVERSOS 


4.148. Determine o valor aproximado de 
uy (0,02)? (0,98)298 + (9 oen: (0,98)297 


e dê uma interpretação probabilística. 


4.149.8e X tem distribuição normal com média 4 e variância c?, X? tem distribuição qui- 
quadrado com 1 grau de liberdade? (v. Problema 4.36.). 


4.150.Generalize o Problema 4.37 provando que se X,,...,X, são variáveis aleatórias 
v 


independentes distribuídas normalmente com média O e variância 1, entáo 3X 
tem distribuição qui-quadrado com » graus de liberdade. 


4.151.Se X4,..., X, são variáveis aleatórias independentes com distribuição qui-quadrado 
com i ‚Ра graus de liberdade, respectivamente, determine a função de distri- 
buição de X, + +++ + X4. 


n 
4,152. Calculando as séries (a) Y x ——— — — NE (b) 3 т? a nl prove direta 
1=0 ы 


Te el (n— g)!’ 


mente os resultados do Problema 4.8 
4.153.Determinc a função geratriz de momentos da distribuição hipergeométrica. 
4,]54.Sejam as variáveis independentes Хр, К = 1, ..., п, cada uma com distribuição 


n 


geométrica. Prove que A tem distribuição de Pascal (v. pág. 169). 


4.155. A lei fraca dos grandes números pode ser deduzida do teorema do limite central? Justifi- 
que sua resposta. 


4.156.Prove o teorema do limite central para o caso em que Жу, Xo, ... são independentes 
mas não têm necessariamente a mesma distribuição. 


4.157.Complete a prova da equação (8) do Problema 4.60, pág. 205. 
4:158. Prove o Teorema 4-5, pág. 166. 


4.159. Prove que 

i ^? соз ша ч 

2a Ap ed (a0, > 0) 
ral d 


4.160. Prove os resultados (20) e (23), pág. 163. 


214 PROBABILIDADE E ESTATISTICA 


4.161.Prove que, quando » > = ‚ a distribuição de Student tende para a distribuição normal 
padronizada. 


4.162. Discuta o que ocorre com a variância da distribuição t quando (a) v= 1, (Б) у= 2. 


4.163. Discuta o que ocorre com a média e a variância da distribuição F quando (2) v, =2, 
(b) va 24, (O vy +1, 22. 


4.164, A probabilidade de uma molécula de um gás ideal ter velocidade entre v e v + dv é dada 
por eye тот dy 


onde k e T são, respectivamente, a constante de Boltzmann e a temperatura Kelvin do 
gás, Determine (a) a constante с, (Б) a velocidade média, (c) a velocidade mais provável, 
(d) a raiz do quadrado médio (ie., a raiz quadrada da velocidade quadrática média). 
Compare seus resultados com 5, pág. 169. 


PARTE Il 


Estatística 


capítulo 5 


Teoria de Amostragem 


POPULAÇÃO E AMOSTRA. INFERÉNCIA ESTATÍSTICA 


Freqüentemente precisamos, na prática, tirar conclusdes válidas sobre um 
grande grupo de indivíduos ou objetos. Ao invés de examinar todo o grupo 
(chamado população) — o que pode ser difícil ou mesmo impossível — pode-se 
cogitar de estudar apenas uma pequena parte (amostra) dessa população. O objetivo 
é inferir certos fatos acerca da população, a partir de resultados observados na 
amostra; tal processo denomina-se inferência estatistica. O processo de obtenção ou 
extração de amostras é chamado amostragem. 


EXEMPLO 5.1. Podemos querer tirar conclusões sobre as alturas (ou pesos) de 12.000 estu- 
dantes adultos (população), observando apenas 100 estudantes (amostra) selecionados na 
população. 


EXEMPLO 5.2. Podemos querer tirar conclusões sobre a percentagem de peças defeituosas 
fabricadas em uma indústria durante uma semana de seis dias, examinando apenas 20 peças cada 
dia. fabricadas em diferentes períodos do dia. Nesse caso, o conjunto de todas as peças fabrica- 
das durante a semana constitui a população, enquanto que as 120 peças selecionadas para estu- 
do constituem a amostra. 


EXEMPLO 5.3. Podemos querer tirar conclusões sobre a qualidade de uma moeda jogando-a 
=epetidamente. A população consiste de todas as jogadas possíveis da moeda. Poderíamos 
tudar uma amostra constituída, digamos, das primeiras 60 jogadas, registrando as percenta- 
gens de "cara" e “coroa”. 


EXEMPLO 5.4. Podemos querer tirar conclusões sobre as cores de 200 fichas (população) de 
urna escolhendo uma amostra de 20 fichas (com reposição após cada extração). 
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Várias coisas devem ser notadas. Primeiro, a palavra população não tem 
necessariamente o mesmo sentido que lhe é atribuído na linguagem cotidiana, como 
p. ex. na frase “a população de Shreveport é de 180.000 indivíduos”. Segundo, a 
palavra população é usada frequentemente para denotar as observações ou mensura- 
ções, ao invés de denotar indivíduos ou objetos. Assim é que é lícito falar, no 
Exemplo 5.1, da população de 12.000 alturas (ou pesos) e no Exemplo 5.4, da 
população de todas as 200 cores de fichas da urna (algumas delas podendo ser 
iguais). Terceiro, a população pode ser finita ou infinita; o número de elementos 
correspondentes é o tamanho da população, usualmente denotado por N. Analoga- 
mente, o número de elementos da amostra é chamado tamanho da amostra; denota- 
se por n e é geralmente finito. No Exemplo 5.1,N = 12.000, n = 100; no Exemplo 
5.3, N é infinito, n = 60. 


AMOSTRAGEM COM REPOSIÇÃO E SEM REPOSIÇÃO 


Se extraímos um objeto de uma urna, poderemos repô-lo, ou não, na urna 
antes da extração seguinte. No primeiro caso, determinado objeto pode aparecer 
repetidas vezes, enquanto que, no segundo caso, o objeto só pode aparecer uma 
vez. No primeiro caso, temos a amostragem сот reposição; no segundo, amostra- 
gem sem reposição. 

Uma população finita submetida a um processo de amostragem com reposi- 
ção pode, teoricamente, considerar-se infinita, pois dela podemos extrair amostras 
de qualquer tamanho sem jamais esgotarmos a população. Para a maioria dos fins 
práticos, a amostragem de uma população muito grande pode ser considerada 
como amostragem de uma população infinita. 


AMOSTRAS ALEATÓRIAS. NÚMEROS ALEATÓRIOS 


Obviamente, a validade das conclusões sobre uma população depende do 
fato de a amostra ter sido escolhida adequadamente, de forma a representar a 
população suficientemente bem, e rum: dos problemas importantes da inferência 
estatística é precisamente o da escolha da amostra. 

Uma forma de se conseguir isto, no caso de populações finitas, é certificar- 
mo-nos de que cada elemento da população tem a mesma probabilidade de figurar 
na amostra, a qual é então chamada amostra aleatória. Рата populações relativa- 
mente pequenas, a amostragem aleatória pode processar-se por sorteio ou, equiva- 
lentemente, utilizando-se uma tábua de números aleatórios (Apêndice 1) especial- 
mente construída para tal fim. V. Problema 5.43. 

Como a inferência de uma amostra em relação à população correspondente 
não pode ser considerada certa, devemos utilizar a linguagem das probabilidades 
na formulação de qualquer conclusão. 
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PARÂMETROS DA POPULAÇÃO 


Uma população é considerada conhecida quando se conhece a distribuição de 
probabilidade f/x) (função de probabilidade ou função de densidade) da variável 
aleatória associada X. Р. ex., no Exemplo 5.1, se X é uma variável aleatória cujos 
valores são as alturas (ou pesos) dos 12,000 estudantes, então X tem uma distribui- 
ção de probabilidade f/x). 

Se, p. ex., X é normalmente distribuída, dizemos que a população é normal- 
mente distribuída, ou simplesmente, normal. Analogamente, se X tem distribuição 
binomial, teremos uma população binomialmente distribuída, ou uma população 
binomial. 

Há certas quantidades que aparecem em /(x), tais como це o no caso da 
distribuição normal, ou p no caso da distribuição binomial. Outras quantidades 
tais como mediana, momentos, assimetria, etc., podem ser determinadas em termos 
destas. Todas essas quantidades costumam chamar-se parâmetros da população. 
Dada uma população, de tal modo que conheçamos f(x), são também conhecidos 
os parâmetros da população. 

Um caso importante é aquele em que a distribuição de probabilidade fix) da 
população não é conhecida com precisão, embora possamos ter uma idéia geral 
sobre o comportamento de f/x) ou, pelo menos, formular certas hipóteses a respei- 
to, Assim é que podemos ter razões para admitir que uma população seja normal- 
mente distribuída. Em tal caso, desconhecemos um dos valores ue б, ou ambos, 
de modo que podemos querer estimá-los. 


ESTATÍSTICAS AMOSTRAIS 


Podemos extrair amostras aleatórias da população e utilizar essas amostras 
para obter valores que servirão para estimar os parâmetros da população. 

À guisa de ilustração, consideremos o Exemplo 5.1, em que X é uma variável 
aleatória cujos valores são as várias alturas. Para obter uma amostra de tamanho 
100, devemos inicialmente escolher aleatoriamente um indivíduo da população. 
Esse indivíduo (altura) pode tomar qualquer valor, digamos х1, dentre todas as 
alturas possíveis; x, é então o valor de uma variável aleatória X,, em que o índice 
1 indica tratar-se do primeiro indivíduo escolhido. Escolhemos em seguida o segun- 
do indivíduo para a amostra, que pode apresentar qualquer valor x, dentre as 
alturas possíveis, e x, pode considerar-se como o valor de uma variável aleatória 
X;. Podemos continuar este processo até X, оо pois о tamanho da amostra é 100. 
Por questão de simplicidade, admitamos a amostragem como reposição, de modo 
que um mesmo indivíduo pode eventualmente ser escolhido mais de uma vez. 
Neste caso, como o tamanho da amostra é muito menor do que o tamanho da 
população, a amostragem sem reposição dará praticamente os mesmos resultados 
que a amostragem com reposição. 
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No caso geral, uma amostra de tamanho n seria descrita pelos valores 
Xy Xj Хп das variáveis aleatórias Xi Xs, ..., An. No caso de amostragem 
com reposição, Xi, Xs, .. ., Хъ seriam variáveis aleatórias independentes, identi- 
camente distribuídas, com distribuição de probabilidade f(x). Sua distribuição 
conjunta seria então 


Р(Х = 01, X2= as ..., Xam) = fan) fo») > Hen) (1) 
Qualquer quantidade obtida de uma amostra para fins de estimação de um 


parâmetro da população é chamada estatística amostral, ou simplesmente estatis- 
tica. Matematicamente, uma estatística amostral para uma amostra de tamanho n 


pode definir-se como uma função das variáveis aleatórias Xi, ..., An, isto é, 
g(Xi, ..., Xu). A função 9(Х,..., Xn) é outra variável aleatória cujos valo- 
res são representados por y(W1, ---> Xa). A palavra estatística é frequentemente 


utilizada seja para designar a variável aleatória, ou seus valores; o sentido particular 
é indicado pelo contexto. 

Em geral, para cada parâmetro da população há uma estatística a ser calculada 
com base na amostra. Usualmente, o método de obtenção dessa estatística a partir 
da amostra é análogo ao da obtenção do parâmetro a partir de uma população 
finita, pois uma amostra consiste de um conjunto finito de valores. Como veremos, 
entretanto, este processo nem sempre produz a “melhor estimativa” e um dos 
importantes problemas da teoria da amostragem é decidir como construir a estatís- 
tica amostral adequada que constitua a “melhor estimativa” do parâmetro da popu- 
lação, Tais problemas serão abordados em capítulos ulteriores. 

Sempre que possível, utilizaremos letras gregas, tais como и, о, etc., para os 
valores dos parâmetros da população, e letras romanas т, s, etc., para os valores das 
correspondentes estatísticas amostrais. 


DISTRIBUIÇÕES AMOSTRAIS 


Como vimos, uma estatística amostral calculada a partir de Х,,..., X, é 
uma função dessas variáveis aleatórias e é, portanto, ela própria uma variável aleató- 
ria. A distribuição de probabilidade de uma estatística amostral costuma chamar-se 
distribuição amostral da estatística. 

Alternativamente, podemos considerar todas as amostras possíveis de tama- 
nho n, que podem ser extraídas da população, e para cada uma delas calcular a 
estatística. Dessa maneira, obtemos a distribuição da estatística, que é sua distri- 
buição amostral. 

Naturalmente, podemos calcular, para uma distribuição amostral, a média, a 
variância, desvio padrão, momentos, etc. O desvio padrão nesse caso também se 
chama erro padrão. 
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A MÉDIA AMOSTRAL 


Sejam Xi, Xs, . . ., Хь variáveis aleatórias para uma amostra de tamanho 
n tal como descrita acima. Então, a média da amostra, ou média amostral, é uma 


variável aleatória definida por 


da Xi + + esa + Ж» 
x=“ (2) 


н 
рог analogia com (3), página 107. Se X1, X2, +. Xn denotam valores obtidos 
em uma determinada amostra de tamanho п, então a média dessa amostra é dada 


por 


5 жї Eta et + а 
2 = A A 5 
т (3) 


EXEMPLO 5.5. Se uma amostra de tamanho 5 acusa 05 valores 7, 9, 1, 6, 2, então a média 
каенана T+9+1+6+2 
5 


DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS 


Seja f/x) a distribuição de probabilidade de certa população da qual extraí- 
mos uma amostra de tamanho п. É natural procurarmos determinar a distribuição 
de probabilidade da estatística amostral X , que é chamada distribuição amostral 
da média da amostra, ou distribuição amostral das médias. A esse respeito, são 
importantes os seguintes teoremas. 


Teorema 5-1: A média da distribuição amostral de médias, denotada por uz, ё 
dad: 3 
арт AZ) = o u) 
onde u é a média da população. 
O Teorema 5-1 afirma que o valor esperado da média amostral é a média da 
população. 


Teorema 5-2: Se a população é infinita, ou se a amostragem é com reposição, então 
a variância da distribuição amostral de médias, denotada por ox, É 
dada por 


EZ] = e (5) 


PIN 


onde o? é a variância da população. 


Teorema 5-3: Se a população tem tamanho N, se a amostragem é sem reposição, e 
se o tamanho da amostra é n < №, então (5) é substituída por 
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ao passo que ue é dado ainda por (4). 
Note-se que (6) se reduz a (5) quando N > 2. 


Teorema 5-4: Se a população da qual se extraem as amostras tem distribuição nor- 
mal com média ие variância o? então a média amostral é normal- 
mente distribuída com média y e variância 02/n. 


Teorema 5-5: Suponhamos que a população da qual se extraem amostras tenha 
uma distribuição de probabilidade — não necessariamente normal — 
com média y e variância 0?. Então, a variável padronizada associada 


aX, dada por 
X= 
z= =E (7) 
„үп 
é assintoticamente normal, isto é 
(8) 


O Teorema 5-5 é uma consequência do teorema do limite central, página 
161. Supõe-se aqui que a população seja infinita ou que a amostragem seja com 
reposição. Em caso contrário, os resultados acima serão corretos se substituirmos 
o/yn em (7) por оз tal como dado em (6). 


DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES 


Seja uma população infinita, binomialmente distribuída, com p e q = 1 — p 
representando respectivamente as probabilidades de determinado elemento acusar, 
ou não, certa propriedade. P. ex., a população pode consistir da totalidade de jo- 
gadas de uma moeda honesta, em que a probabilidade do evento “cara” é p = +. 

Consideremos todas as amostras possíveis de tamanho n extraídas desta 
população, e para cada amostra determinemos a estatística P da proporção de 
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sucessos. No caso da moeda, P seria a proporção de “caras” em n jogadas. Obtemos 
então uma distribuição amostral de proporções cuja média up e desvio padrão 
Op são dados por 


СЕГЕ (9) 


о que pode ser obtido de (4) e (5) fazendo-se u =P, с = үрд. 

Para grandes valores de n (n >30) a distribuição amostral está muito próxi- 
ma de uma distribuição normal, tal como se vê do Teorema 5-5. 

Para populações finitas em que a amostragem é sem reposição, a segunda 
equação em (9) é substituída por cz tal como dado por (6) com с = ypg. 

Note-se que as equações (9) se obtêm mais facilmente dividindo-se por n a 
média e o desvio padrão (np e V PQ ) da distribuição binomial. 


DISTRIBUIÇÃO AMOSTRAL DE DIFERENÇAS E SOMAS 


Suponhamos dadas duas populações. Para cada amostra de tamanho л, 
extraída da primeira população calculemos uma estatística S; . Isto nos dá uma dis- 
tribuição amostral para 5; cuja média e desvio padrão denotaremos por us, € 0s, 
respectivamente. Analogamente, para cada amostra de tamanho n, extraída da 
segunda população, calculemos uma estatística S, cuja média e desvio padrão são 
Hg, € Os, respectivamente. 

Considerando todas as combinações possíveis dessas amostras das duas popu- 
lações, podemos obter uma distribuição das diferenças S, — $,, chamada distribui- 
ção amostral das diferençãs das estatísticas. A média e o desvio padrão dessa dis- 
tribuição amostral, denotadas respectivamente рог. ps, s, € ags,» 810 dadas 


por 
Es, iss = Vos, tos, (10) 


desde que as amostras escolhidas não dependam uma da outra por qualquer forma, 
isto é, as amostras devem ser independentes (em outras palavras, as variáveis aleató- 
rias S, eS, são independentes). 

_ Se. р.ех.,5, eS, são as médias amostrais de duas populações, denotadas por 
X,, X,, respectivamente, então a distribuição amostral da diferença de médias é 
dada, para populações infinitas com média e desvio padrão и, о, € My, 0, respec- 
tivamente, por 


Ed T BRE 


"5-5 tg, 


(11) 


224 PROBABILIDADE E ESTATÍSTICA 


empregando (4) e (5). Este resultado também vale para populações finitas no 
caso de amostragem com reposição. A variável padronizada 


(12) 


em tal caso tem distribuição muito aproximadamente normal se ny e n, são grandes 
(na, nz >30). Resultados análogos podem obter-se para populações finitas, no caso 
de amostragem sem reposição, empregando-se (4) e (6). 

Podem-se obter resultados correspondentes para distribuições amostrais de 
diferenças de proporções de duas populações binomialmente distribuídas com 
parâmetros p,, q, e рз, 4, respectivamente. Neste caso, $, eS, correspondem às 
proporções de sucessos P, e P, e as equações (11) dão 


E = — E тее д 
Hri- T tro tr T PT Pao Ор ‚= ов, ор, 


(18) 


Ao invés de diferenças, pode eventualmente interessar-nos a soma de estatís- 
ticas. Em tal caso, a distribuição amostral da soma das estatísticas S, e S, tem 
média e desvio padrão dados por 


= Ex ACE 2 
sis = Ms, T Ms, Osis, = Ves, + 05, (14) 


supondo-se as amostras independentes. Podem-se então obter resultados análogos 
а (11). 


А VARIÂNCIA AMOSTRAL 


Se Xi, Xs, ..., Xn denotam as variáveis aleatórias para uma amostra de 
tamanho n, então a variável aleatória que dá a variação da amostra ou variância 
amostral é definida, por analogia com (14), pág. 110, por 
(Xi — EP + 0G-Xy + (Mi XP 

п (15) 
Ora, no Teorema 5-1 vimos que E(X) = u ; seria interessante se tivéssemos tam- 
bém E(S?) = o?. Sempre que o valor esperado de uma estatística é igual ao 
correspondente parámetro da população, dizemos que a estatística é um estimador 
não-tendencioso e o valor obtido é uma estimativa não-tendenciosa do parâmetro. 
Acontece, entretanto (v. Problema 5.20) que 
п 1 


HS) = ва = =P (16) 


S = 
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que está muito próximo de 02 somente para grandes valores de n (digamos n > 30). 
O estimador n&o-tendencioso desejado é definido por 

NN (Xa À + (XS — Xy 
n=l E nt 


de modo que RG = оо" (18) 


& = 


Em razão disso, alguns estatísticos preferem definir a variância amostral por 92 ao 
invés de S? substituindo simplesmente п por п —1 no denominador de (15), por- 
que, com isto, muitos resultados ulteriores se simplificarão. 


EXEMPLO 5.6. Reportando-nos ao Exemplo 5.5, pág. 221, a variância amostral tem o valor 


Р (4 — 62 + (7—6)2 + (5—6)? + (8 —6)2 + (6—6) _ о 
# = E = 


ao passo que uma estimativa não-tendenciosa é dada por 
(4 — 6)2 + (T— 0? + (5-6)? + (8 — 6)? + (6—6)2 

4 4 
Os resultados acima valem no caso de amostragem de população infinita, ou 
de população finita com reposição. Se se trata de amostragem sem reposição de po- 
pulação finita de tamanho N, então a média da distribuição amostral de variâncias 
é dada por 

ES) = us = (7 


Quando N > «o a expressão acima se reduz a (16). 


$$ = Bu 


Ss 2,5 


N 


(19) 


DISTRIBUIÇÃO AMOSTRAL DE VARIÂNCIAS 


Tomando todas as amostras aleatórias possíveis, de tamanho п, de uma po- 
pulação, e calculando a variância de cada amostra, obtemos a distribuição amostral 
das variáncias. Ao invés de determinar a distribuição amostral de 5? ou КЕ propria- 
mente, é conveniente determinar a distribuição amostral da variável aleatória 
relacionada 


nS? _ (n- SE (Xi XP (ХХ) + (ХХ) 
a CS 2 - 


о? с с" 


(20) 


A distribuição desta variável aleatória é descrita no seguinte teorema. 


Teorema 5-6: Se extraímos amostras aleatórias de tamanho п de uma população 
normal, então a variável amostral (20) tem distribuição qui-quadrado 
com n — 1 graus de liberdade. 


| 
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Em razão do teorema 5-6, a variavel (20) costuma designar-se por ж? . Para 
demonstração deste teorema, у. Problema 5.22. 


CASO EM QUE A VARIÂNCIA DA 
POPULAÇÃO É DESCONHECIDA 


Nos Teoremas 5-4 e 5-5 vimos que a variável padronizada 


Ё = = (21) 


é normalmente distribuída se a população da qual se extraem amostras tem distri- 
buição normal, enquanto que é assintoticamente normal se a população não é nor- 
mal, desde que n> 30. Em (21) naturalmente supusemos conhecida a variância 
o? da população. 

Cabe agora indagar o que ocorrerá se não conhecermos a variância da popu- 
lação. Uma possibilidade será estimarmos a variância da população utilizando uma 
ou mais variâncias amostrais e levarmos então o correspondente desvio padrão em 
(21). Melhor ainda será substituirmos o o em (21) pela variável aleatória S que 
dá o desvio padrão amostral e procurarmos determinar a distribuição da estatística 
correspondente, que designaremos por 


Xp -u 


(22) 


3 


Pode-se mostrar, aplicando o Teorema 4-6, pág. 167, que T tem distribuição de 
Student 7 com n — 1 graus de liberdade. Tal resultado acha-se consubstanciado no 
teorema seguinte, cuja demonstração é objeto do problema 5.24. 


Teorema 5-7: Se extraímos amostras aleatórias de tamanho п de uma população 
normalmente distribuída, então a estatística (22) tem distribuição 
de Student com n — 1 graus de liberdade. 

O Teorema 5-7 vale mesmo no caso de amostras extraídas de populações que não 

são normais, mas que têm distribuições em forma de sino, como a distribuição 

normal. 

Pelo fato de não precisarmos conhecer a variância da população, costumamos 
referir-nos ao tipo de amostragem acima como pertencendo à teoria das pequenas 
amostras, ou teoria da amostragem exata. 


TEORIA DA AMOSTRAGEM 227 


Tábua 5-1 
ERRO PADRÁO DE ALGUMAS ESTATISTICAS AMOSTRAIS 


бе Erro Padrão Observações 
OS! 
ei PA 


Válido para grandes ou pequenas 

amostras quando a população é infi- 

nita ou a amostragem é com reposi- 

= c ção. Distribuição amostral das médias 

Médias SEC A mui aproximadamente (assintotica- 
mente) normal se n 30 mesmo 
quando a população é náo-normal 

E ГЫТ média da população em 
todos os casos 


ы pli—p) > Valem igualmente aqui as observa- 
Proporções op = 4| = = 0) 5) без feitas para médias ¿Hp =P em 


todos os casos 


| in pe 
Para л > 30 a distribuição amostral 
Onça = eq = das medianas é mui aproximadamen- 

ên te normal. O resultado vale somente 


Medianas 1.2583 0 se a população é normal ou aproxi- 
= == madamente normal 


a Heg = M 


Para n > 100 a distribuição amostral 
de S é mui aproximadamente normal. 
о? é dado por (1) só se a população 
é normal ou aprox. normal. Se a po- 
pulação é não-normal, pode-se empre- 
gar (2). Note-se que (2) se reduz a (1) 
quando y , = 30? o que é verdadeiro 
para populações normais. 
Para n> 100,0; = 0 muito aprox. 


(0) е 


Desvios padráo 


СУ 
a 
a 


Valem igualmente aqui as observa- 
ções feitas para o desvio padrão. 
0 da = Pu Note-se que (2) dá (1) no caso de 
população normal 

Hg» = (1-00 fn 
o que está muito próximo de 0? 
para n grande (n > 30). 


| 
Variáncias 


(2 о, 
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DISTRIBUIÇÃO AMOSTRAL DE RAZÕES DE VARIÂNCIAS 


Na página 223 indicamos como se podem obter distribuições amostrais de 
diferenças, em particular de diferenças de médias. Utilizando as mesmas idéias, po- 
derfamos chegar à distribuição amostral de diferenças de variâncias, digamos ¡SE 
Acontece, entretanto, que tal distribuição amostral é bastante complicada. Em lu- 
gar dela, podemos considerar a estatística Susi, pois uma razáo muito grande ou 
muito pequena indicaria uma grande diferenga, enquanto que uma razáo muito 
próxima de 1 indicaria pequena diferenga. 


Teorema 5-8: Sejam duas amostras aleatórias independentes de tamanhos т € и, 
extraídas de duas populações normais com variâncias oi, o; respec- 
tivamente. Então, as variâncias das amostras são dadas por si Si 
respectivamente, a estatística 


mSif(m — Do? _ KDE Е 
пи I? 7 Sus (en 


tem distribuigáo F com m — 1, n — 1 graus de liberdade. 
O teorema pode também aplicar-se ao caso de distribuições não-normais, 
porém em forma de sino. 


OUTRAS ESTATÍSTICAS 


Podem-se definir, em relação a amostras, muitas outras estatísticas além da 
média e da variância. Por exemplo, a mediana, a moda, os momentos, assimetria, 
kurtosis, etc. Suas definições são análogas ás dadas para populações no Capítulo 3. 
Freqüentemente é possível determinar distribuições amostrais para tais estatísticas 
ou, pelo menos, suas médias e desvios padrão (erros padrão). A tábua da pág. 227 
dá algumas dessas estatísticas, juntamente com as já estudadas. 


DISTRIBUIÇÕES DE FREQUÊNCIA 


Se uma amostra (ou mesmo uma população) é grande, torna-se difícil obser- 
var as diversas características ou calcular estatísticas tais como média, desvio 
padrão, etc. Por isto, é útil organizar ou grupar os dados originais (dados brutos). 
A título de ilustração, consideremos uma amostra das alturas de 100 estudantes de 
sexo masculino da Universidade XYZ. Podemos dispor os dados em classes ou 
categorias e determinar o número de indivíduos que pertencem a cada classe; esse 
número é chamado freqüéncia da classe A disposição resultante (Tábua 5-2) é 
chamada distribuição de fregiiência ou tábua de fregiiência. 
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Tábua 5-2 
ALTURAS DE 100 ESTUDANTES 2 
DA UNIVERSIDADE XYZ 


Altura Número de 
(polegs.) Estudantes 
5 


t 
Nº de Estudantes (Freqüéni 


60-62 

| 63—65 18 

| 66—68 42 

| 69—71 27 

| quc * ^ Aliuralipolegula d E 
TOTAL 100 Fig. 5-1 


A primeira classe ou categoria, p. ex., consiste de alturas de 60 a 62 polega- 
das, indicada por 60-62 (intervalo de classe). Como 5 estudantes acusam alturas 
pertencentes a esta classe, a freqüéncia de classe correspondente é 5. E como uma 
altura indicada como 60 está efetivamente entre 59,5 e 60,5, enquanto que uma al- 
tura dada como 62 está entre 61,5 e 62,5, poderíamos também ter indicado o in- 
tervalo de classe como 59,5—62,5. O intervalo seguinte seria então 62,5—65,5, etc. 
No intervalo de classe 59,5-62,5, os números 59,5 e 62,5 costumam chamar-se 
fronteiras de classe, ou limites de classe. A amplitude do intervalo de ordem /, 
denotada por с;, que é usualmente a mesma para todos os intervalos de classe (caso 
em que então se denota por c), é a diferença entre o limite superior e o limite 
inferior da classe. No nosso сазо, с = 62,5 — 59,5 = 3. 

Pode-se tomar para representar uma classe o respectivo ponto médio. Na tabela 
acima, o ponto médio da classe 60-62 é 61. 

Como gráfico de uma distribuição de freqüéncia pode-se adotar um histogra- 
ma (sombreado na Fig. 5-1) ou um polígono (polígono de fregiiência) ligando os 
pontos médios dos topos do histograma. Note-se que a forma do gráfico parece 
indicar que a amostra foi extraída de uma população normal. 


DISTRIBUIÇÕES E OGIVAS DE FREQUÊNCIAS RELATIVAS 


Se na Tábua 5-2, ao invés do número de estudantes em cada classe, tivésse- 
mos anotado a freqüéncia relativa ou percentagem, o resultado seria uma distri- 
buição de freqüéncia relativas, ou de percentagens. P. ex., a freqüéncia relativa, ou 
percentagem, correspondente à classe 63-65 é 18/100 ou 18%. O histograma é 
análogo ao da Figura 5-1, exceto quanto ao fato de que o eixo vertical representa 
frequências relativas, ao invés de freqüéncias. A soma das áreas retangulares é 
então 1, ou 100%. И 
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Podemos considerar uma distribuição de frequências relativas como uma 
distribuição de probabilidade em que as probabilidades são substituídas por fre- 
qüéncias relativas. E como as freqüéncias relativas podem ser encaradas como 
probabilidades empíricas (v. pág. 8), podemos cogitar das distribuições de fregiiên- 
cias relativas como distribuições empíricas de probabilidade. 

No Capítulo 2 vimos que era possível associar a cada distribuição de proba- 
bilidade f/x) uma função de distribuição definida por F (x = P (X < х) bem co- 
mo fazer o gráfico desta função. Por analogia, podemos associar a cada distri- 
buição de freqüéncia uma distribuição de fregiiência acumulada ou distribuição 
cumulativa de freqüéncia relativa, cujos gráficos associados são comumente chama- 
dos de ogivas, ou ogivas de percentagens. V. Problema 5.30. 


CÁLCULO DA MÉDIA DA VARIÂNCIA E DOS 
MOMENTOS PARA DADOS GRUPADOS 


Podemos representar uma distribuição de frequência como na Tábua 5-3, 
dando os pontos médios das classes, e as correspondentes frequências. A frequência 
total é n, isto é, 

n = fitfe+ th= DÍ 


Tábua 5-3 
Ponto Médio T Frequência da Classe 


TOTAL 


Como há f, números iguais a x, f, iguais a x;, ..., fk iguais a xy, a média é dada 
por 
fea _ Bfe 


fizi + fata + 
n mn 


(24) 


Analogamente, a variância é dada por 


A а Ph _ XS (og 


52 
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Note-se a analogia de (24) e (25) com os resultados (2), página 107, e (13), página 
110, se fj/n corresponde a probabilidades empíricas. 

Quando os intervalos de classe tém todos a mesma amplitude, c, há métodos 
abreviados para o cálculo da média e da variáncia. Tais métodos utilizam a transfor- 
mação do ponto médio x em um valor inteiro dado por 

X = 0а + си (26) 


onde а é um ponto médio escolhido arbitrariamente, correspondente a u = 0. As 
fórmulas da média e da variância são então 


d) == pude 25 fu = а + ей (27) 
2 _ „|> fZfu P st 
2 = d [ m GR ) ] = eu = (28) 


Existem fórmulas análogas para momentos de ordem superior. Assim, os momentos 
de ordem ғ em relação à média e à origem, respectivamente, são dados por 
fits — Ey ++ + felt — 4)" Xf(e—ay 


mh. cm tT Wa 2 E b ed (29) 


ficte į i 
E ug EL 0 "E d 30 
МАР n n (80) 


Os dois tipos de momentos estáo relacionados por: 


yn = 0 
ma = qn$— m? 
(81) 
ma = mi— 3m4m | 2m4 
ma = mã- Атта + 6m?as- 38m 
etc. Se escrevemos 
ZXf(w—uy X fut 
M, = med M! = t 
n y 


então as relações (31) também são válidas entre os MM. Mas 


E flla+ eu) — (a + em _ > fe(u— üy 


Е n n 


Mr = 
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de forma que, de (31), obtemos as fórmulas 
m = 0 
ms = Mi М?) 
ma = (Mi MIM 2M) 
ma = c(Mi— AMIM 4 GMT MS — ЗМ) 


(32) 


etc. A segunda equação de (32) é, obviamente, a mesma equação (28). 


De modo análogo, podemos determinar outras estatísticas para as amostras, 
tais como assimetria, kurtosis, etc. 


Problemas Resolvidos 
DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS 


5.1. Uma população consiste dos números 2, 3, 6, 8, 11. Consideremos todas as 
amostras possíveis, de tamanho 2, que podem ser extraídas dessa população, 
com reposição. Determine (a) a média da população, (b) o desvio padrão da 
população, (c) a média da distribuição amostral de médias (d) o desvio padrão 
da distribuição amostral de médias, isto 6, o erro padrão das médias 
(a) , AER, 6 


- Е = 60 


(2—6)? + (3—6)? + 16—6)2 + (8 — 6) + (11 — 6)? 


(b) o? = 


94044485 
= 1810404448 108 e c=329. 


(с) Há 5(5) = 25 amostras de tamanho dois, sem reposição (pois qualquer dos cinco núme- 
ros da primeira extração pode associar-se a qualquer dos números da segunda extração). 
Essas amostras são: 

(2,2) (2,3) (2,6) + (2,8) (2,11) 


(3,2) (3, 3) (8,6) (3,8) (3,11) 
(6,2) (6,3) (6, 6) (6,8) (6,11) 
(8,2) (8, 3) (8,6) (8,8) (8,11) 


(11,2) (11,8) (11,6) (11,8) (11,11) 
As médias amostrais correspondentes são: 


TEORIA DA AMOSTRAGEM 233 


2,5 4,0 5,0 6,5 
3,0 4,5 5,5 7,0 

40 45 6,0 7,0 8,5 
5,0 55 7,0 8,0 9,5 
6,5 7,0 8,5 95 1,0 


e a média da distribuição amostral das médias é 


uz = Soma de todas as médias amostrais em (1) _ 150 - 60 
25 e 25 


o que ilustra о fato que pz = u. Para uma demonstração geral; v. Problema 5.6. 


(d) Obtém-se a variância da distribuição amostral de médias substraindo a média 6 de cada 
número em (1), elevando o resultado ao quadrado, somando todos os valores assim ob- 
tidos, e dividindo por 25. O resultado final é 

оф = 182 = 5,40 domodo que ox = V540 = 232 
Isto ilustra o fato que, para populações finitas envolvendo amostragem com repo- 
sição (ou populações infinitas), 02 = 02/n pois o membro direito é 10,8/2 =5,40, 
o que está de acordo com o valor obtido acima. Para uma demonstração geral, v. 
Problema 5.7. 


5.2. Resolva o Problema 5.1 para o caso de amostragem sem reposição. 
Tal como em (a) e (b) do Probl. 5.1, u- 6 e 02 „10,8, 0=3,29. 


(с) Há 5С» = 10 amostras de tamanho dois, sem reposição, que podem ser extraídas da 
população (isto significa que podemos extrair um número e em seguida outro número 
diferente do primeiro), a saber 5 


(2,3), (2,6), (2,8) (2,11), (3,6), (3,8), (3,11), (6,8), (6,11), (8,11) 
A escolha (2, 3), p.ex., é considerada idéntica á escolha (3, 2). 
As médias amostrais correspondentes são 
2,5, 4,0, 5,0, 6,5, 4,5, 5,5, 7,0, 7,0, 8,5, 9,5 
e a média da distribuição amostral de médias é 
25440450 +65 +45 + 5,5 + 10 67,0 +85 + 95 


аў = 10 = Y 
o que ilustra o fato que ux = л. 


(d) A variância da distribuição amostral de médias é 
_ (8.8— 6,07? + (4,0 — 6,0)? + (5,0 — 6,0)? + --- + (9,5 — 6,0)? 
Е 10 


[4 


: = 405 
e eg = 5,01. 
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Isto ilustra o fato дис? = 
5 


LI o membro direito é igual a 


acima. Para uma demonstração geral, v. Problema 


5.3. Suponhamos que as alturas de 3.000 estudantes de sexo masculino em uma 
universidade tenha média 68" e desvio padrão 3”. Extraindo-se 80 amostras de 
25 estudantes cada uma, quais seriam a média e o desvio padrão da distribuição 
amostral de médias no caso de (а) amostragem com reposição, (b) amostragem 
sem reposição? 


Teoricamente, os totais de amostras com reposição e sem reposição, de tamanho 
25, de um grupo de 3.000 são, respectivamente, (3.000)% e , С, ambos muito 
maiores que 80. Por conseguinte, não obtemos uma distribuição amostral verdadeira, mas 
apenas uma distribuição amostral experimental. Não obstante, como o número de amos- 
tras é grande, deve haver aproximação satisfatória entre as duas distribuições amostrais. 
Logo, a média e o desvio padrão esperados devem estar próximos dos valores correspon- 
dentes da distribuição teórica. Temos, pois 


(a) ug = u = 68,0 polegadas e 
c 3 
> = Z = 25. polegadas 
x - +6 polegadas 
vn v25 
(6) uz = и = 68,0 polegadas e 


сс = АМ = 208 |3000 — 25 
RT uRNN-1.— gg N 30001 


que difere apenas por muito pouco de 6”, podendo, portanto, para fins práticos, ser con- 
siderado como o mesmo valor obtido por amostragem com reposição. 

Podemos, então, admitir que a distribuição experimental das médias tem distri- 
buição aproximadamente normal com média 68” e desvio padrão 0,6”. 


5.4. Em quantas amostras do Problema 5.3 podemos esperar que a média esteja 
(a) entre 66,8" е 68,3", (b) abaixo de 66,4"? 


А média amostral X . em unidades padronizadas, é aqui dada por 
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(a) 66,8 em unidades padronizadas = (66,8 — 68,0)/0,6 = —2,0 
68.3 em unidades padronizadas — (68,3 — 68,0)/0,6 — 0,5 
Proporção de amostras com média entre 66,8” e 
68,3” = (área sob a curva normal entre z=-2,0 e 
z=0,5) =(área entre z=-2 e z=0)+ (área entre 
z=022z2=0,5)=0,4772 + 0,1915 = 0,6687. 
Número esperado de amostras 
=(80(0,6687) ou 53. 
(b) 66,4 em unidades padronizadas = (86,4 — 68.0)/0,6 = —2,67 
Proporção de amostras com média inferior a 
66,4" = (área sob a curva normal à esquerda de 
z=-2,67) (área à esquerda de z 20) — (área 
entre z =- 2,67 e z=0)=0,5 — 0,4962 = 0,0038. 
Então, o número esperado de amostras é (80)(0,0038) = 0,304, ou seja, aproxi- 
madamente Zero. 


2,67 


Fig. 5-3 


5.5. 500 mancais acusam peso médio 5,02 oz e desvio padrão 0,30 oz. Determine a 


probabilidade de 100 mancais, extraídos aleatoriamente desse grupo, terem um 
peso médio (a) entre 496 e 500 oz., (b) de mais de 510 oz. 


Para a distribuição amostral de médias их = н = 5,02 oz, 
o [м-т 0,80 , [500 — 100 _ 
= = > = 0,027 
k va N N=1 vio V 500—1 ^ 


(a) O peso médio estará entre 496 e 500 oz. se о peso médio da amostra de 100 mancais 
estiver entre 4,96 e 5,00 oz. 
4,96 em unidades padronizadas = (4,96 — 5,02)/0,027 = —2,22 
5,00 em unidades padronizadas = (5,00 — 5,02)/0,027 = —0,74 
Probabilidade desejada 


= (área entre z = —2,22 € 


= (área entre z = —2,22 e 
— (área entre z=—074 e 2=0) 


= 0,4868 — 0,2704 = 0,2164 


E 
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(В) O peso total excederá 510 oz. se o peso médio dos 100 mancais da amostra exceder 
5,10 oz. 
5,10 em unidades padronizadas = (5,10 — 5,02)/0,027 = 2,96 
Probabilidade desejada 
=(área à direita de z = 2,96) = (área à direita de z = 0) 
— (área entre z =0 e z = 2,96) =0,5 — 0,4985 =0,0015 
Assim, há apenas três chances em 2.000 de ser extraída uma amostra de 100 man- 
cais com peso total excedendo 510 oz. 


Fig. 5-5 
5.6. Prove o Teorema 5-1, pág. 221. 
Como X, Xs, ..., X, são variáveis aleatórias com a mesma distribuição que 
a população , que tem média |, temos 
EX) = a k=1,2,...,1n 


Entáo, como a média da amostra é definida por 


n 
temos 


5.7. Prove o Teorema 5-2, pág. 221. 


Temos 
SA owe d 


n 


d. X, 
E 


Entáo, como Xp. são independentes е têm variância v? , temos, pelos 


Teoremas 3-5 е 3-7, 


n 


\ 


РЗ 2 
Var) = ¿Var(X) to +E Var(X) = (e) =- £ 


DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES 


5.8. Determine a probabilidade de que, em 120 jogadas de uma moeda, aparegam 
(a) entre 40% e 60% de caras, (b) $ ou mais caras. 


Consideremos as 120 jogadas como uma amostra das infinitas jogadas possíveis 


TEORIA DA AMOSTRAGEM 237 


da moeda. Em tal população, a probabilidade de “cara” é p = } a probabilidade de 
coraé q =1—p= 4. 


(a) Queremos a probabilidade de o número de caras, em 120 jogadas, estar entre 48 e 72. 
Procedendo como no Cap. 4, utilizamos a aproximação normal para a distribuição 
binomial, Como o número de caras é uma variável discreta, procuraremos a probabili- 
dade de o número de caras estar entre 47,5 e 72,5. 


в = nº esperado de caras = пр = (1) = 60 
3 2 = Yap = azo(5 (5) = 548 
47,5 em unidades padronizadas = пе = 2,98 
72,5 em unidades padronizadas — BAN = 2,98 


Probabilidade desejada = (área sob a curva normal entre z =- 2,28 e z =2,28) = 2( área 
entrez 20 e z=2,28) = 2 (0,4887) = 0,9774. 


L 25 2,28 
Fig. 5-6 
Outro Método. 
и үтү q id 
up = p = y = 050 ор = = o = 0,0456 
40%em unidades padronizadas = do = 819 
; 0,60 — 0,50 — 
60%em unidades padronizadas = MN = 219 


Assim, a probabilidade procurada é a área sob a curva normal entre Z =-2,19 
ez= 2,19, isto é, 2(0,4857) = 0,9714. 

Conquanto o resultado esteja certo até a segunda decimal, não é rigorosamente 
certo, pois não levamos em conta o fato de que a proporção é na realidade, uma va- 


riável discreta. Para levar em conta este fato, devemos subtrair Jh ooh 
2n  2(120) 
1 l i РЕ 
de 0,40 e somar | = 0,60. Assim, como 1/240 = 0,00417, as propor- 
le e somar эс = осуу im, como A as propor 
ções em unidades padronizadas são 
0,40 — 0,00417 — 0,50 _ -2,28 ë 0,50 + 0,00417 — 0,50 = 228 


0,0456 0,0456 
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5.9. 


5.10. 
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o que está de acordo com o primeiro método. 
Note-se que (0,40 — 0,00417) e (0,60 +0,00417) correspondem às proporções 
47,5/120 e 72,5/120 no primeiro método acima. 


(b) Utilizando o segundo método de (a), encontramos (pois # = 0,6250 ). 


(0,6250 — 0,00417) em unidades padronizadas — 0,6250 — 0,00417 — 0,50 
= 2,65 0,0456 
Probabilidade procurada = (área sob a curva normal à direita de z = 2,65) 
=(área à direita dez =0) — (áreaentrez=0 e т=2,65) 
= 0,5 — 0,4960 = 0,0040. 


De um grupo de 500 pessoas, cada uma joga uma moeda 120 vezes. De quan- 
tas pessoas podemos esperar um resultado (2) entre 40% e 60% de caras, (b) 


& ou mais caras? 


Este problema está estreitamente relacionado com o Problema 5.8. Temos aqui 
500 amostras, de tamanho 120 cada, da populagáo de todas as infinitas jogadas de uma 
moeda. 


(а) A parte (a) do Problema 5.8 afirma que, de todas as amostras possíveis, cada uma 
constituída de 120 jogadas de uma moeda, podemos esperar uma percentagem de 
97,74% com 40% a 60% de caras. Em 500 amostras podemos então esperar cerca de 
97,74%, ou sejam, 489 amostras com esta propriedade. Segue-se que podemos esperar 
cerca de 489 pessoas com seus resultados entre 40%е 60% de caras, 

É interessante notar que os resultados de 500 — 489 = 11 pessoas são tais que não 
se pode esperar "caras" entre 40% е 60%. Essas pessoas poderiam, pois, concluir que 
suas moedas estavam viciadas (muito embora as mocdas, na realidade, fossem hones- 
tas). Este tipo de erro é um risco — sempre presente quando lidamos com probabili- 
dades. 


(b) Raciocinando como em (а), concluímos que cerca de (500)(0,0040) = 2 pessoas acu- 
sariam ¿on mais caras em seus resultados. 


Constata-se que 2% das peças fabricadas por determinada máquina são defei- 
tuosas. Qual a probabilidade de, em um lote de 400 de tais pegas (a) 3% ou 
mais, (b) 2% ou menos, serem defeituosas? 


ap = p = 0,02 е gre E ye 


(a) Utilizando a correção para variáveis discretas, 1/2» — 1/800 — 0,00125, temos 
(0,03 — 0,00125) em unidades padronizadas .. 0,03 — 0,00125 — 0,02 _ 1. 
0,007 5s 


Probabilidade procurada = (área sob a curva normal à direita de z = 1,25) = 0,1056. 
Se não tivéssemos utilizado a correção, obteríamos 0,0764. 


sii. 
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Outro Método. 


(3% de 400) = 12 peças defeituosas, Em base contínua, 12 ou mais peças equiva- 
lem a 11,5 ou mais. 


к = (2% de 400) = 8 o = Упра = у(400)(0,02)(0,98) = 2,8 


Então, 11,5 em unidades padronizadas = (11,5 — 8)/2,8 = 1,25, como anteriormente, e 
a probabilidade procurada é 0,1056. 


0,02 + 0,00125 — 0,02 


(5) (0,02 + 0,00125) em unidades padronizadas = ET 
„007 


= 0,18 


Probabilidade procurada = (área sob a curva normal à esquerda de z = 0,18) 
=0,5000 + 0,0714 = 0,5714. 
Se não tivéssemos utilizado a correção, teríamos obtido 0,5000, Pode-se empregar 
também o segundo método da parte (a). 


Em uma eleição, determinado candidato recebeu 46% dos votos. Determine a 
probabilidade de que, em um escrutínio efetuado em (a) 200, (b) 1,000 dos 
votantes, se obtenha maioria em favor do candidato. 


aau 1 — Ара . 4[0,26(0,54) _ 9 
(а) Bp = р = 0,46 е op = q ado = 0,0352 


Como 1/2n — 1/400 = 0,0025, a amostra acusará maioria se a proporção em 
favor do candidato for 0,50 +0,0025 = 0,5025 ou mais, (Esta proporção pode ser 
obtida também considerando que 101 ou mais indica maioria, mas esta cifra, como 
variável contínua, é 100,5 e assim a proporção é 100,5/200 = 0,5025.) 

Então, 0,5025 em unidades padronizadas = (0,5025 — 0,46)/0,0352 = 1,21 е 
Probabilidade procurada = (área sob a curva normal à direita dez = 1,21) 
=0,5000 — 0,3869 = 0,1131. 


p = 0,46, op = Vpq/n = V0,46(0,59)/1000 = 0,0158, e 
0,5025 — 0,46 
0,0158 


Probabilidade procurada = (área sob a curva normal à direita de 2 = 2,69) 
=0,5000 — 0,4964 = 0,0036 


(b) ap 


0,5025 em unidades padronizadas = = 2,69 


DISTRIBUICOES AMOSTRAIS DE DIFERENCAS E DE SOMAS 


5.12; 


Seja U; uma variável que representa qualquer dos elementos da população 3, 
7,8 e Us uma variável que representa qualquer dos elementos da população 
2,4. Calcule (a) py (b) to eung (Do, (0) оь,» (1) тшо 
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(0) ny, = média da população U = io 7+8) = 6 
(b) uv, = média da população U, = ie +4) =з 


(c) A população que consiste da diferença entre qualquer elemento de U, e qualquer 
elemento de Us é 


3-2 7-2. 8-2 1 5 
ou 

3-4 т-4 8-4 -d & 

Então pp, q, = médide(U,—U, = A =3 


o que ilustra o resultado geral My, 62 = ty,” dy) COMO se vé de (a) e (b). 


(d) oj = variância da população U, = (3-68P+(7-82+(8-62 _ ы 
ш 3 


оп ор, = Ag 


(2-3)? + (4- 3} 


(e) А = variância da população U, = eue segs E 
ой vy = 1 

(D o2 = variância da população (U; — U;) 
U—Us 


(1—39 -(5—32 + (6-3) + (1 3)2 + (3—3)? + (4—31 _ 17 
6 3 


17 


9-0 T 3^ 


ou 


Isto ilustra o resultado geral para amostras independentes, 
con V "D. + 98,» 
como se vé de (d) e (e). A prova do resultado geral decorre do Teorema 3-7, pág. 
11 
5.13. As lâmpadas do fabricante А têm vida média de 1.400 horas com desvio 
padrão de 200 horas, e as do fabricante B acusam vida média de 1.200 horas e 
desvio padrão de 100 horas. Testando-se amostras aleatórias de 125 lâmpadas 
de cada fabricante, pergunta-se qual a probabilidade de a vida média das lâm- 


padas da marca А ser superior à vida média da marca В (a) em ao menos 160 
horas, (b) 250 horas ou mais? 


9 


Sejam X, e X as vidas médias das amostras A e B, respectivamente. Entáo 


HXQ-Xg Cox, “xy = 1400 — 1200 = 200h 
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2 2 
vA , "B (100)? , (200)? 
CHE — = = X 
оха 42 an Y 125 * 125 оз 
A variável padronizada para a diferenga de médias é 
(La — Em) — (иар) _ (Ea Xy) — 200 


ie vg diio 20 


e tem distribuição mui aproximadamente normal. 


(а) A diferença 160 horas em unidades padronizadas é = (160 — 200)/20 = —2. 
Probabilidade procurada = (área sob a curva normal à direita dez — -2) 
=0,5000 +0,4772=0,9772. 


(b) A diferença 250 horas em unidades padronizadas é = (250 — 200)/20 = 2,50. 


Probabilidade desejada = (área sob a curva normal à direita de z = 2,50) 
=0,5000 — 0,4938 = 0,0062. 


5.14. Mancais de determinada fábrica pesam 0,50 oz. com desvio padrão de 0,02 oz. 
Qual a probabilidade de a diferença entre os pesos de dois lotes de 1.000 
mancais cada um ser superior a 2 oz.? 


Sejam X, e X; os pesos médios dos mancais dos dois lotes. Então 


— eg, = 0,50 — 0,50 = 0 


Sa, [0022 , (0,02% 
E ES E ¿0232 | (0, " 
i "s 1000 ^ 1000 ЖОШ 
A rr ip = a a 0 
P P RS = — 0000895 


e tem distribuigáo mui aproximadamente normal. 
Uma diferenga de 2 oz. entre os dois lotes equivale a uma diferenga de 2/1.000 — 
=0,002 oz. nas médias. Isto pode ocorrer se 


X,— Š, > 0,002 ou X,— X, < —0,002, ie. 


0,002 — 0 
0,000895 


=й в. Ze 5020 - 0 


ЕФ 0,000895 - 


Entáo 


P(Z>2,23 or Z <-—2,23) 


P(Z>2,28) + P(Z&—2,23) = 2(0,5000 — 0,4871) 
= 0,0258 
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515. 


5.16. 


(a) 


(5) 


5.17. 


Фра eL. 


A e B disputam um jogo “cara e coroa” cada um jogando 50 moedas. А ganha 
se obtiver 5 ou mais “caras” mais do que B. Em caso contrário, В ganha. 
Determine as chances contra 4 de ganhar qualquer jogo. 


Sejam Pa e Pr as proporções de caras obtidas por À e por В. Admitindo todas 
as moedas honestas, a probabilidade p de caras é 4. Então 


trap; 7 tr gg = 0 
id 2004) 
sya TE = 4/24 = DE - 010 
“Pa Pg “Ba ii “Pp na ив 50 e 


A variável padronizada para a diferença de proporções é Z = (Pa- Pp= 0)/0,10. 
Em base contínua, 5 ou mais caras equivalem a 4,5 ou mais caras, e assim a diferença 
entre as proporções deve ser 4,5/50 = 0,9 ou mais, isto é, Z é no mínimo igual a 
(0,09 — 0)/0,10 = 0,9 (ou Z> 0,9). A probabilidade correspondente é a área sob a cur- 
va normal à direita de Z = 0,9, que é 0,5000 — 0,3159 = 0,1841. 

Assim, as chances contra 4 de ganhar uma partida, são (1-0,1841): 0,1841 = 
=0,8159:0,1841,0u 4,43 a 1. 


Medem-se duas distâncias, obtendo-se 27,3” e 15,6”, respectivamente, com 
desvios padrão (erros padrão) de 0,16” e 0,08”. Determine a média e o desvio 
padrão (a) da soma, (Р) da diferença das distâncias. 


Denotando por D, e D as distâncias, 


dojo, E to Poo, = 2718 + 156 = 429 polegadas 
ошко, = Va Fo, = VO 16P + (0,08 = 0,18 polegadas 
ton, = to tm = 273166 = MV polegadas 


op», = Voa, qub = VO 167 + (0,08? = 0,18 polegadas 


Certa marca de lâmpada elétrica tem vida média de 1.500 horas, com desvio 
padrão de 150 horas. Ligam-se três lâmpadas de tal modo que, quando uma 
queima, outra acende. Admitindo-se normalmente distribuídas as vidas mé- 
dias, qual a probabilidade de o iluminamento permanecer (а) no mínimo 
5.000 horas, (Р) no máximo 4.200 horas? 


Denotemos as vidas médias por Ly, Ly e Га. Então 


(ny T Hn, tr, + n, = 1800 + 1500 + 1500 = 500 horas 
ылыы = Мор, КО! V3(150)? = 260 horas 
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(a) 5.000 horas em unidades padronizadas = (5.000 — 4.500)/260 = 1,92 
Probabilidade procurada = (área sob a curva normal à direita de z = 1,92) 
=0,5000 — 0,4726 = 0,0274. 


(5)4.200 horas em unidades padronizadas = (4.200 — 4.500)/260 = — 1,15. 


Probabilidade procurada = (área sob a curva normal à esquerda de z = -1,15) 
0,5000 — 0,3749 = 0,1251. 


DISTRIBUICAO AMOSTRAL DE VARIÁNCIAS 

5.18. Com referência ao Problema 5.1, determine (a) a média da distribuição amos- 
tral das variâncias, (b) o desvio padrão da distribuição amostral das variâncias, 
isto é, o erro padrão das variâncias. 


(a) As variâncias amostrais correspondentes a cada uma das 25 amostras do Problema 5.1 


são 
0 0,25 4,00 9,00 20,25 
0,25 0 2,25 6,25 16,00 
4,00 2,25 0 1,00 6,25 
9,00 6,25 1,00 0 2,25 
20,25 16,00 6,25 2,25 0 


A média da distribuição amostral de variâncias é 


— soma de todas as variáncias da tabela acima "m 135 6 
ug = = = 540 
25 25 


Isto ilustra o fato que jg» — (2 — 1)(02)/n, pois, ратат = 2e 02 = 10,8 (v. Proble- 
ma 5.1(5)), o membro direito é $(10,8) = 5,4. 


O resultado indica por que se costuma definir a variância corrigida para amostras por 
n 
"o 


&- 


Se, 


pois decorre então que gs = а? (v. também observações nas págs. 224—225). 


(b)A variância da distribuição amostral de variáncias °$: se obtém subsiraindo-se a mé- 
dia 5,40 de cada um dos 25 valores da tábua supra, elevando ao quadrado os resulta- 
dos, somando-os e dividindo o total por 25. Assim, o2, — 575,75/25 = 
og = 4,80. a 

7 


ça 


5.19. Faça o problema anterior no caso de amostragem sem reposição. 


(a) Há 10 amostras cujas variáncias são dadas pelos números acima (ou abaixo) da diago- 
nal de zeros na tábua do Problema 5.18(0). Então 
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_ 0,25 + 4,00 + 9,00 + 20,25 + 2,25 + 6,25 + 16,00 + 1,00 + 6,25 + 2,25 
us = 10 


= 6,15 


N = 
Trata-se de um caso especial do resultado geral ge = (к^) (e Ж De 


(equação (19), pág. 225) como se pode verificar fazendo-se N = 5, n= 2e 0? = 10,8 
no membro direito, para obter и = (200,8) = 6,75. 


(b) Subtraindo | 6,75 de cada um dos 10 números acima da diagonal de zeros na tábua do 


Problema 5.18(4), elevando ao quadrado esses números, somando-os € dividindo o 
1esultado por 10, obtemos o2, — 39,675 ou а = 6,80. 


5.20. Prove que 


HS) = 


n 
onde S? é a variância amostral de uma amostra aleatória de tamanho n, tal 


como definida na pág. 224, e o? é a variância da população. 


Método 1. 
Temos 
X-X = Xx-hxa+ o +X)= La DX, - X. - єз» ==] 
= LA) A "+ — O9 
Então 
qu-x3s» = о + Got oo 


+ (X, — д)? + termos retangulares) 
Como os XX são independentes, a esperança de cada termo retangular é zero, donde 


E(X,-Xy] = Fin- 1RE[QG — 02] + EX 09 + t + E 7 291 


& Ln + gio ded) 


ж=] „ 
Ba 


= Ilus) = E 


Analogamente, E[(X, — X)?] = (n — 1)o?/n para k= 2,...,. Assim 


5.21. 
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ES) = Ір + EP] 


= Еа "D 
n n n 


Método 2. 
Temos ХХ =(X,—1)—(X—u). 

Então (X,—X)2 = (X,— а)? — 205 (X — в) + (X— a)? 
а) Б(Х—Х#% = X% – AX) 500-0 + LX 9? 

onde o somatório é de 7 = 1 an. Isto pode ser escrito como 
500-08 = EQ-a — mE — 1)? + mu X — y)? 

= EXP — (E — py? 

pois Ж(Х;—н) = EX, — nu = n(X—u). Tomando a esperança de ambos os 


membros de (2) e utilizando o Problema 5.7, obtemos 


a| 3,2] = el 3o-4] — nE(E — 03 


2 
=” СӨ = (n—1)? 
т 


donde E = fa 


Prove o Teorema 5-4, pág. 222. 


Se X, j=1,2,...,m, tem distribuição normal com média Ше variância 
02, então sua função característica é (v. Tábua 4-2, pág. 159). 
bla) = PLC 
A função característica de X; Xa+: +X, é, então, pelo Teorema 3-12, 
pla) = gilo) palu) pnl) = ейшо — QGa*u!)/3 
pois os Xj são independentes. Então, pelo Teorema 3-11, a função característica de 
XQ, Ж X, 
n Е 


в 


в A 
dy = «(3) = ошо Eo* mtl 


Mas esta é а função característica de uma distribuição normal com média Le variância 
6? Jn, e, assim, o resultado desejado decorre do Teorema 3-13. 
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5.22. Prove o Teorema 5-6, pág. 225. 
Por definição, (e —1)82 = E (X,— X) Decorre então de (2), Método 2, 


Probl. 5.20, que V = V, + Vs, onde 
2 (у д) 
аё E 
Mas, pelo Teorema 4-3, pág. 166, V tem distribuição qui-quadrado com п graus de li- 
berdade (como se vé substituindo X por (X5 — 1)/0). Outrossim, pelo Probl. 5.21, 
X tem distribuição normal com média Le variância с/т. Portanto, pelo Teorema 4-3 
com > = 1 e Ху substituído por (X — д)//о°/п, vemos que V; tem distribuição 
qui-quadrado com 1 grau de liberdade. Segue-se do Teorema 4-5, pág. 166, que se Vi 
e V, são independentes, então V; tem distribuição qui-quadrado com n — 1 graus de 
liberdade. Como podemos mostrar que V, e V; são realmente independentes (Problema 
5.135), temos o resultado desejado. 


2-089 


5.23. (a)Use o Teorema 5-6 para determinar o número esperado de amostras no 
Probl. 5.1 para o qual a variáncia amostral é superior a 7,2. (b) Confira o 
resultado de (2) com o resultado efetivo. 


(a) Temos m = 2, o? = 10,8 [Problema5.1'(b)], Para s? = 7,2. temos 


2 
тат (2)(7,2) 
TA „ 1064 - 183 
EI 10,8 ps 
Mas de acordo com o Teorema 5-6, x^ = 15%/0? = 255º/10,8 tem distribuição qui- 


quadrado com 1 grau de liberdade. Da Tábua no Apéndi segue-se que 


P(S2>s2) = PQSPBL33) = 0,25 


Podemos assim esperar cerca de 25% das amostras (ou sejam, 6), com variáncia 
superior a 7,2. 


(Б) Do Problema 5.18 constatamos, mediante contagem, que há efetivamente 6 varián- 
cias superiores a 7,2, de forma que há acordo entre os resultados. 


CASO EM QUE A VARIÂNCIA DA 
POPULAÇÃO É DESCONHECIDA 


5.24. Prove o Teorema 5-7, pág. 226. 


E-—u _ ns? 
rr E n 
mente distribuídos com média ¿e variância 02 sabemos (Probl. 5.21) que ¥ tem dis- 
tribuição normal com média ие variância o?/n, de modo que Y tem distribuição normal 
com média O e variância 1. Outrossim, pelo Teorema 5-6, pág. 225, ou Problema 5.22, Z 


Seja | Y = » = »—.Entüo, como os Xj são normal- 
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tem distribuição qui-quadrado com r = n — 1 graus de liberdade. 
Segue-se do Teorema 4-6, pág. 167, que 
y . eb 


VE Sai 


tem distribuição f com n — 1 graus de liberdade. 


Xp 
Sva 
. Conforme a tábua de distribuição / de Student para 1 grau de liberdade 


(Apêndice D), temos Р(—1,376< Т «& 1,876) — 0,60. Verifique se tal 
resultado é confirmado pelos resultados obtidos no Problema 5.1. 


un 
to 
p 


Dos valores de X em (1), pág. 232 e dos valores de 5? no Probl. 5.18(a), obte- 
mos os seguintes valores para T — (X — 4)/(S/V1): 


Е —7,0 -1,0 0,83 0,11 
1,0 ЕС 1,0 —0,20 0,25 
-1,0 1,0 - 1,0 1,0 
—0,83 —0,20 1,0 =. 2,88 

011 0,25 1,0 238 E 


Há efetivamente 16 valores para os quais —-1,376« T < 1,376 quando na realidade 
poderíamos esperar (0,60)(25) = 15. A concordância não é má, considerando-se o 
pequeno número de dados em causa. Este método de amostragem foi, de fato, o método 
que levou originalmente Student a obter a distribuição г. 


DISTRIBUICAO AMOSTRAL DE RAZÓES DE VARIÁNCIAS 


5.26. Prove o Teorema 5-8, pág. 228. 


Denotemos as amostras de tamanhos men por. Xy. 
respectivamente. Então, as variáncias amostrais são dadas por 
m 
y2 1 o o 1 As 
S = — E-Xx, == 5 -fe 
1 mit aja? 


onde Y, Y são as médias amostrais. И : 
Mas, pelo Teorema 5-6, pág. 225, sabemos que mSj/o; e "'Ss/ey têm distri- 
buição qui-quadrado com т — 1 e m —1 graus de liberdade, respectivamente. Assim, 
pelo Teorema 4-7 pág. 168, decorre que 
msm 


Do; 


tem distribuição F com m — 1, n — 1 graus de liberdade. ` 


. Extraem-se duas amostras de tamanhos 8 e 10 de duas populações normal- 
mente distribuídas, com variâncias 20 e 36, respectivamente. Determine a 
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probabilidade de a variáncia da primeira amostra ser superior ao dobro da 
variância da segunda. 


se 


Temos m=8, n=10, c? — 20, оў = 36. Assim, 
851/(1)(@0) „5i 
1053/(9)(36) 


Os números de graus de liberđade do numerador e do denominador são 
n=m-1=7, mn=n-1=5. 

Ora, se S? é mais do dobro de S2, ie, se Si > 255, então F> 3,70. Recorrendo à 
Tábua do Apéndice F, vemos que a probabilidade é inferior a 0,05, porém superior a 
0,01. Para obter valores mais exatos, necessitaríamos de uma tábua mais extensa da 
distribuição F. 


DISTRIBUIÇÕES DE FREQUÊNCIA 


5.28. Na Tábua 5-4, encontram-se os pesos de 40 estudantes do sexo masculino de 
uma universidade americana, com aproximação de 1 Ib. Construa uma distri- 
buição de frequência. 


Tábua 5-4 


164 150 182 144 
158 140 147 136 
126 138 176 163 
173 142 147 135 
145 135 142 150 


O maior peso é 176 Ib, o menor é 119 lb. Intervalo: 176 — 119 = 571b. 
Utilizando-se 5 intervalos de classe, cada um será de 57/5 — 11, aprox. 
Utilizando-se 20 intervalos de classe, cada um será de 57/20 = 3, aprox. 

Uma escolha conveniente para o intervalo de classe é 5 Ib. Também é conveniento 
escolher os pontos médios como 120, 123, 130, 135, ... Ibs. Podemos, pois, tomar como 
intervalos de classe 118-122, 123-127, 128-132, ... Os extremos das classes serão então 
117,5, 122,5, 127,5, ... que não coincidem com os dados observados. 

A Tábua 5-5 exibe a distribuição de fregiiência desejada. A coluna do centro é 
utilizada apenas para efeito de contagem, e costuma omitir-se na apresentação final. 


Outra possibilidade. 


Existem naturalmente outras distribuições de frequência. A Tábua 5-6, p.ex., 
apresenta uma distribuição com 7 classes apenas, com 9 1b. como intervalo de classe. 
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Tábua 5-5 
Peso (lb) Contagem Fregiiência 


118-122 d 
123—127 
128—132 
183—137 
138—142 
143—147 
148—152 
158—157 
158—162 
163—167 
168-172 
173—177 


TO ка оз го з л OO OC» d PO DO юк 


5.29. Construa um histograma e um polígono de freqüéncia para a distribuição de 
pesos do Problema 5.28. 


As Figuras 5-7 e 5-8 ilustram o histograma e o polígono de fregiiéncia para os dois 
casos considerados no Problema 5.28. Note-se que os centros das bases dos retângulos 
coincidem com os pontos médios. 


Tábua 5-6 


Peso (lb) Contagem Freqüóncia 


UA 


118—126 


127-185 74 5 
136—144 — 7A. HU 9 
145—153 FL THH LE 12 
154—162 У 5 
163—171 lt 


172—180 HH 


Peso (libras) 
Fig. 5-7 


- 
à 
| 
| 
| 
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Fregüéncia 
1 


Т T T T T 
113 122 131 140 149 158 167 176 185 


Peso (libras) 
Fig. 5-8 


5.30. Jogam-se cinco moedas simultaneamente 1.000 vezes anotando-se o número 
de caras em cada jogada. A. Tábua 5-7 exibe os nümeros de jogadas em que 
apareceram 0, 1,2, 3, 4 e 5 caras. (a) Faça um gráfico dos dados. (b) Construa 
uma tabela das percentagens de jogadas que resultaram em menos de 1, 2, 3, 
4, 5 ou 6 caras. (c) Faça um gráfico dos dados da tábua em (b). 


Tábua 5-7 


Número de 
Número de jogadas 
caras (fregiiência) 


TOTAL 1000 


(a) Os dados podem ser apresentados graficamente seja como na Fig. 5-9 ou na Fig. 5-10. 

A Fig. 5-9 parece mais natural, já que o número de caras não pode sez, p.eX., 1, ou 
3,2. Trata-se de um gráfico em barras, onde cada barra tem amplitude zero. É espo- 
cialmente indicado para o caso de dados discretos. 
A Fig, 5-10 é un histograma dos dados. Note-se que a área total sob o histograma é 
igual à fregiiéncia total 1.000, como deve ser. Utilizando a represontação mediante 
histograma ou polígono de fregiiência estamos tratando os dados como se realmente 
fossem contínuos. 


Número de jogadas 


0 X 


| | 
2 3 4 5 


Número de caras 


Fig. 59 


Número dejogadas 
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Número de caras 
Fig. 5-10 


(b) Referindo-nos à Tábua 5-8, vemos que ela dá a distribuição de frequência acumulada 
e a distribuição de frequências percentuais acumuladas, para o número de caras. 
Note-se que as entradas “menos de 1”, “menos de 2”, etc., poderiam igualmente ser 
indicadas por “menor do que, ou igual a 0”, “menor do que, ou igual a 1”, etc. 


Tábua 5-8 

| Número de jogadas Percentagens de jogadas 
| Número de caras (freg. acumulada) (acumulada) 
| menos de 0 | 0 0,0 
| menos de 1 | 38 3,8 
| menosde2 — | 182 182 

menos de 3 524 524 

menos de 4 811 81,1 

menos de 5 975 97,5 

menos de 6 1000 100,0 
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1004 Å= hiss a 
804 


604 


E 
è 
П 


40 + 


Percentagem de jogadas 
Percentagem de jogadas 


S 
Ei 
1 


207 


$01 3 8 4 в 6 0 1 2 3 4 Б 6 
Nümero de caras Número de caras 
Fig. 5-11 Fig. 5-12 


(c) O gráfico pode assumir a representação da Fig. 5-11 ou da Fig. 5-12. 

A Fig. 5-11 é mais natural para dados discretos, pois, p.ex., a percentagem de jo- 
gadas em que aparecem menos de 2 caras é igual à percentegem em que aparecem 
menos de 1,75, 1,56 ou 1,23, de modo que a mesma percentagem, 18,2% deve apa- 
тесег em referência a esses valores (indicada pela linha horizontal). 

A Fig. 5-12 dá o polígono de frequências acumuladas, ou ogiva, e, em essência, 
trata os dados como se fossem contínuos. 

Note-se que as Figs. 5-11 e 5-12 correspondem, respectivamente, às Figs, 5-9 e 
5-10 da parte (a). 


CÁLCULO DA MÉDIA, DA VARIÂNCIA E DOS 
MOMENTOS PARA AMOSTRAS 


5.31. Determine a média aritmética dos números 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 
4,5,4,8, 2, 5,4. 


Método 1. 
2 = Bê — 5+3+6+5+4+5+2+8+6+5+4+8+3+4 
n d 20 
+5+4+8+2+5+4 _ 96 _ 4g 
20 20 ШЧ 
Método 2. 


Há seis 5, dois 3, dois 6, cinco 4, dois 2 e trés 8. Entáo 


à = 


Efe _ (610) + (218) + (2)(6) + (5)(4 
n 


) + (2)(2) + (3X8) _ 96 
6+2+245+2+3 
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5.32. Quatro grupo de estudantes, consistindo de 15, 20, 10 e 18 indivíduos, acu- 
sam pesos médios de 162, 148, 153 e 140 Ibs., respectivamente, Determine o 
peso médio do conjunto de estudantes. 


_ fe (1511162) + (201148) + (1010153) — (181040) 


= o 15 | 20 110 - 18 TRO bis 


5.33. Use a distribuição de frequência de alturas da Tábua 5-2, pág. 229, para deter- 
minar a altura média dos 100 estudantes do sexo masculino da Universidade 
XYZ. ` 


O trabalho acha-se esboçado na Tábua 5-9. Note-se que todos os estudantes com 
altura 60-62, 63-65, etc., são considerados como tendo alturas 61, 64, etc., respectiva- 
mente. O problema se reduz então a determinar a altura média de 100 estudantes, dos 
quais 5 têm altura 61”, 18 têm altura 64”, etc. 


Tábua 5-9 
Altura (polegs.) Ponto Médio (x) Freqüóncia (f) je 
60—62 61 5 305 
63—65 64 18 1.152 
66-68 87 42 = 2814 
69—71 70 27 1.890 
72—74 73 8 584 
— M a 
_ _ Хук Efe _ 6745 _ q, n= ў = 100 Ife = 6.745 
сааш. Ж Cm оре ш. 


Os cálculos podem tornar-se longos, especialmente quando os números são gran 
des e há muitas classes. Há técnicas apropriadas para abreviar o trabalho em tais casos. V, Pro- 
blema 5.35, p.ex. 


5.34. Deduza a fórmula (27), página 230, para a média aritmética. 


Seja Ху o ponto médio da classe de ordem j. Então o desvio de xja contar de um 
ponto médio especificado, a, é «;— a, e será igual ao intervalo de classe multiplicado 
por um inteirou;, ie.;x;—a = cu; ou х; = а 1 cu; (que também se escreve abre- 
viadamente como ж = a + cu). 

A média é então dada por 


3f, _ Bhate) _ 037, З 


n n n ^ mn 


ёа = 


Хуу; 
сех 
т 


а + сӣ 
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pois n= 2f; 
5.35. Utilize a fórmula do problema 5.34 para determinar a altura média dos 100 


estudantes do sexo masculino da Universidade XYZ (v. Problema 5.33). 


O trabalho pode ser disposto como na Tábua 5-10. Este método deve ser empre- 


gado sempre que for possível. 
d Tábua 5-10 


x u fu 
61 —2 
64 e. 
a 67 0 
70 1 
78 2 
E 1 (ун _ As = "m 
Ф = ad e Je = 67 4 (35) 67,45 polegadas 


5.36. Determine (а) a variância, (Р) o desvio padrão dos números do Problema 5.31. 


(a) Método 1. 


Tal como no Problema 5.31, temos & — 4,8. Então, 


a (a _ 3482 + (6— 4,8)2 + (5= 4,8)2 + ec + (4— 4,8)? 
n s 20 
— 59,20 A 
i — 2,96 


Método 2. 5? = 
(4 — 4,82 + 202 — 48)? + 5(8 — 48)? 


59,20 
= TÉ а 206 
20 „96 
De (a), 82 = 2,96 е в = y2,96 = 1,36. 


5.37. Determine o desvio padráo dos pesos dos estudantes do Problema 5.32. 


2 fa — 5)? 
т 


8% = 


15(162 — 150)? + 20(148 — 150)° + 10(153 — 150)2 + 18(140 — 150) 
15 + 20 + 10 + 18 


_ 4130 " 2 
= us 65,6 (libras) 


Então s = y 65,6 (libras)? = V65,6 libras = 8,10 libras, já que as unidades seguem 
as leis ordinárias da álgebra. 
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5.38. Determine o desvio padráo das alturas dos 100 estudantes do sexo masculino 
da Universidade XYZ. V. Problema 5.33. 


Do Problema 5.33, 2 — 67,45 polegadas. O trabalho pode dispor-se como na 


Tábua 5-11. 
Tábua 5-11 

——1 

(= — 2)2 Froqiiéncia” f Қа — 2) 
————— 

41,6025 5 208,0125 

11,9025 18 214,2450 

0,2025 42 8,5050 

6,5025 27 175,5675 

30,8025 246,4200 

Efla—a) = 
=3/= 
канын 852,7500 


E E 
q ZEE = 0 8921900 _ VBT — 2,92 polegadas 


5.39, Deduza a fórmula (28), página 231, para a variância. 


Tal como no Problema 5.34, temos xj = a + cu; e 


ER q а + ей 
п 
Entao 
$ nd 2 1 
8? "T Lea. = o. Y feu сй)? 
= E3 tua 
= ÉS pu аа 
= ж fj(u —- Zuy& + ù?) 


= 20202 + chu? 


- E " my 


-apm (ей 


= ga 


dd 
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5.40. Use a fórmula do Problema 5.39 para determinar o desvio padrão das alturas 
do Problema 5.33. 


O trabalho pode dispor-se como na Tabela 5-12. Isto nos permite determinar 
3 como no Problema 5.35. Da última coluna temos então 


"e “[®геё (S&'] = e-a 


n ya 


E e Er] ы я 
= (8) 100 (22) 8,5275 


e assim s = 2,92 polegadas. 


Tábua 5-12 
fu I he 
—— 
5 -10 20 
18 =18 18 
42 0 0 
27 27 27 
8 8 32 
n=Ef- 100 3 fu = 15 


5.41. Determine os quatro primeiros momentos em relagáo á média para a distri- 
buição de alturas do Problema 5.33. 


Prosseguindo o método do Problema 5.40, obtemos a Tábua 5-13, 


Tábua 5-13 
fu fé fut 
—40 80 
-18 18 
0 0 
21 27 
64 128 
хуа = 38 | 2/u1=253 


Então, usando a notação da página 232, temos 


з ER 
m; = 28 = 015 м = — = 0,85 


м; = ХР _ дэт Mis = 2,58 
т 
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e de (32), 
m = 0 
ma = e(M,— M) = 910,97 — (0,15)2] = 8,5275 
ma = eML—3MIML 1 2MP) = 27/0,83 — 3(0,15)(0,97) + 2(0,15)8] = —2,6932 


га. 


ma = (M4 = 4MM, + 6M/M) —3M/ 
= 8102,58 — 4(0,15)(0,88) + 6(0,15)*(0,97) — 8(0,15)*] = 199,3759 


5.42. Determine os coeficientes (a) de assimetria e (b) de kurtosis para a distribui- 
ção de alturas do Problema 5.33. 


(a) Do Problema 5.41, 
m, — s? = 8,5275 та = —2,6932 


Então, coeficiente de assimetria = аз = 


(b) Do problema 5.41, 


am, = 199,3759 m, = s? = 8,5275 
Ma 
Então, coeficiente de kurtosis = q = E 
199,3759 _ 
(8,5275)2 — Bii 


Por (a) vê-se que a distribuição é moderadamente assimétrica à esquerda. De (5) 
vemos que acusa um pico um pouco menos acentuado que a curva normal (que tem 
coeficiente de kurtosis = 3). 


PROBLEMAS DIVERSOS 


5.43. (a)Mostre como escolher 30 amostras aleatórias de 4 estudantes cada uma 
(com reposição) da tábua de alturas da página 229, utilizando uma tabela 
de números aleatórios. (b) Determine a média e o desvio padrão da distri- 
buição amostral de médias em (a). (c) Compare os resultados de (b) com os 
valores teóricos, explicando as discrepâncias que houver. 


(a) Use dois dígitos para numerar cada um dos 100 estudantes: 00, 01, 02,..., 99 (v. 
Tábua 5-14). Assim, os cinco estudantes com altura 60-62 têm números 00-04, os 
dezoito estudantes com altura 63-65 têm números 05-22, etc. Cada númeto assim 
atribuído a um estudante se chama número amostral. 
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Tábua 5-14 
(polegs.) | Fregüéncia Amostral 
H 
10-62 5 00-04 
63-65 18 05-22 
66—68 E 23-64 
69—71 27 65-91 
72—74 8 92-99 
14 


Extraímos em seguida números aleatórios da tábua do Apéndice 1. Na primeira 
linha encontramos a segiiéncia 51, 77, 27, 46, 4D, etc., quc tomamos como números 
aleatórios; cada um deles se associa á altura de determinado estudante. Assim, 31 
corresponde a um estudante com altura 66-68 polegadas, que consideramos como 
67” (ponto médic). Analogamente, 77, 27, 46 correspondem às alturas de 70, 67, 67 


polegadas, respectivamente. 


Por este processo, obtémos a Tábua 5-15 que apresenta os números amostrais 
extraídos, as alturas correspondentes, e a altura média para cada uma das 30 amos- 
tras. Note-se que, embora tenhamos partido da primeira linha da tábua de números 
aleatórios, poderíamos igualmente ter partido de qualquer ponto e seguido qualquer 
padrão especificado. 


Tábua 5-15 
Números amostrais Alturas Altura Números amostrais | Alturas Altura 
extraídos correspondentes | média extraídos | correspondentes | média 
я. 51,77,27,46 | 67,170, 67,67 | 67.75 16. 11, 64, 55, 58 | 64, 67, 67, 67 
2. 40,42, 33, 12 67, 67, 67, 64 66.25 17. 70, 56, 97, 43 | 70, 67, 73, 67 
3. 90, 44, 46, 62 70, 67, 07, 67 67.75 18. 74, 28,93, 50 | 70, 67, 73, 67 
а. 16,28,08,93 | 64,07, 79,73 | 69.25 19. 79,42, 71, 30 | 70, 07, 70, 67 
5. 58,20, 41, 86 67, 64, 67, 70 67.00 20. 58,60,21,33 | 67,67, 04, 67 68.25 
в. 19,64,08,70 | 64,67, 64,70 | 66.25 21. 75,79, 74,54 | 70, 70, 70,67 | 69.25 
7. 56,24, 03, 32 67, 67, 61, 67 65.50 22. 06,31,04,18 | 64, 67, 61, 64 64.00 
8. 34,91,83,58 | 67,70, 70, 67 23. 07,07, 12,97 | 70, 64, 64,73 | 67.75 
9. 70,65, 68, 21 70, 70, 70, 64 24. 31, 71, 69, 88 | 67, 70, 70, 70 69,25 
40. 96,02,13,87 | 73, 61, 61,70 25. 11,01, 21, 87 | 64,67, 61, то | 66.25 
11. 76,10, 51, 08 70, 64, 67, 64 26. 03, 58, 57, 93 | 01, 67, 67, 73 67.00 
12. 63, 97, 45,39 | 6T, 73, 51,67 27. 53, 81, 93, 88 | 67, 70, 73,70 | 70.00 
13. 05,81, 45,93 | 64, 70,67,73 | 68.50 28. 23, 22,96,79 | 67,64,73,70 | 6850 
14. 96, 01,73,52 | 73,61, 70,67 | 67.75 29. 98, 50, 59, 36 | 73, 67, 67, 67 | 08.50 
15. 07,82,54, 24 | 64,70,67,67 | 67.00 30. 08, 15, 08, 84 | 64,64, 64, 70 | 65.50 
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Tábua 5-16 
Média amostral | Contagem / u fu һе 
| 64,00 / 1 Е -4 16 
64,75 0 -3 0 0 
65,50 " 2 -2 -4 8 
86,25 TM | 6 E -6 6 
a— 67,00 mt 4 0 0 0 
67,75 It 4 1 4 4 
68,50 IL H 7 2 14 28 
69,25 ШИ 5 3 15 45 
70,00 f 1 4 4 16 
L 
3/=n=30 Уук = 98 х he = 123 


(b) A Tábua 5-16 dá а distribuição de frequência das médias amostrais obtidas em (a). É 
a distribuição amostral de médias. A média e o desvio padrão se obtêm na forma 
usual, pelos métodos já descritos. 


07,00 + 


(0,75)(23) 
3 


67,58 pols. 


(c) A média teórica da distribuição amostral de médias, нӯ, é igual à média da popula- 
ção д que é 67,45”. (v. Problema 5.33), o que concorda com o valor 67,58 da parte 


(b). 


O desvio padrão teórico (erro padrão) da distribuição amostral de médias, ox, é 
igual a e/v/m, onde o desvio padrão da população é o 
e o tamanho da amostra é n = 4. Como a/y/n = 292//4 = 1,46”, há concordân- 
cia com o valor 1,41” da parte (b). As discrepâncias observadas se devem ao fato que 


escolhemos somente 30 amostras e que o tamanho das amostras é pequeno. 


2,92” (v. Problema 5.40) 


5.44. O desvio padrão dos pesos de uma população muito grande de estudantes é 
10,0 lbs. Extraem-se dessa população amostras de tamanho 200 cada uma, e 
calcula-se o desvio padráo das alturas de cada amostra. Determine (a) a média, 
(b) o desvio padrão da distribuição amostral de desvios padrão. 


Podemos considerar a amostragem indiferentemente como de uma população 
infinita, ou de uma população finita, com reposição. Da Tábua 5-1, página 227, temos: 
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(a) ив = е = 10015 
10 

b s = —= ——— = 0,50 1b 

e "5 7 VE уш í 


5.45. Que percentagem das amostras do Problema 5.44 teria desvio padráo (4) supe- 
rior a 11,0 Ibs., (5) inferior a 8,8 Ibs.? 


A distribuição amostral de desvio padrão é aproximadamente normal com média 
10,0 Ibs. e desvio padrão 0,50 Ibs. 


(a) 11,0 lbs. em unidades padronizadas = (11,0 — 10,0)/0,50 = 2,0. Área sob a curva 
normal à direita de z = 2,0:0,5 — 0,4722 = 0,0228"; logo, a percentagem procurada 


é 2,3% 

(b)8,8 lbs. em unidades padronizadas = (8,8 — 10,0)/0,50 = — 2,4.Árcasob a curva 
normal à esquerda de z= —2.4:0,5 — 0,4918 = 0,0082 ; logo, a percentagem 
procurada é 0,8%. 


5.46. Toma-se uma amostra aleatória de 6 observações de uma população. Qual a 
probabilidade de as duas últimas observações serem inferiores às quatro pri- 
meiras? 


Suponhamos que a população tenha função de densidade f(x). A probabilidade de 
3 das quatro primeiras observações serem maiores que u, enquanto que a quarta está 
entre u e u +du é dada por 


" " 
(2) al f А ҳи) du 
E 


A probabilidade de as duas últimas observações serem inferiores a u (c assim, inferiores 
às quatro primeiras) é dada por 


e Lf. fo) а] 


Então, a probabilidade de as 4 primeiras serem maiores do que u e as duas últimas serem 
menores que u é 


(9) (s [ f LIE, d [ f " f) d. ] 


Como и pode tomar valores entre — co e os, a probabilidade total de as duas últimas 
observações serem menores que as quatro primeiras é a integral de (3) de — os a о 


isto é, 
E a 37 pu 2 
w af Е! re) de] [ у лә de | Fui) du 
Para calcular isto, seja i 
= (e) а: 
6) v= fom 
Então 


(6) dv = f(u) du 1-0 = Ha) de 
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Quando u = =, v = 1e quando u ==, v = 0. Assim (4) se torna. 


| a 
FS | sN1—vfde = 
Jo 


ача КЕЯ 
que é a probabilidade procurada. É interessante notar que a probabilidade não depende 
da distribuição de probabilidade f(x). Temos aqui um exemplo de estatística não- 
paramétrica, já que não precisamos conhécer nenhum parâmetro da população. 


5.47. Seja UG, Xs, ....Xs) uma amostra aleatória de tamanho n extraída, sem 
reposição, de uma população finita de tamanho N. Prove que se a média e a 
variância da população são и е o? então 
(а) E(X) = п, (b) Cov (X5 Xr) = —o"/(N — 1). 


Suponha-se a população constituída do conjunto de números Хар, аз, An), 
onde os «” não são todos necessariamente distintos. Um processo de amostragem alea- 
tória é aquele em que cada escolha de n dentre os Na' tem a mesma probabilidade 
(isto é 1/4C, ). Isto significa que os X7 são identicamente distribuídos. 

( a prob, 1/N 


| às prob. 1/N 


y c : (¡=1,2,....0) 
| ay prob. 1/N 


Eles náo sáo, todavia, mutuamente independentes. Realmente, quando j Е, a distri- 
buição conjunta de X; e Xy. € dada por 


Р(Х) =, XQma) = Руа) PXS | X; ау) 


NIA = дь | раў 


onde Xe р variam de 1 a N. 
(a) EU = 


(b) Соу (X Xp) = 


К ЖЕ ) E А аы ы 
NUN ji E e ПІС) 


onde o último somatório contém um total de N(N — 1) termos correspondentes a todos 
os pares possíveis de Ле » distintos. 
Mas pela álgebra elementar, 


N N 
[a -atot ay- ШР = E t 2 (о – о) 
№1 №ёр=1 
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5.48. 


Nesta equação, o membro esquerdo é zero, pois, por definição, 
estate tay = Nu 
e o primeiro somatório à direita é, por definição, igual a No2. Logo, 
N 


3 (006—0) -Ne 
A&v=1 


Prove que (a) a média e (b) a variância da média amostral no Problema 547 
são dadas respectivamente por 


(a) 


1 
= РШ =F = p 


onde utilizamos o Problema 5.47(a). 


(b) Utilizando os Teoremas 3-5 e 3-16 (generalizado), e o Problema 5.47, obtemos 


a 


— I Уаг(х) + 3 
кез j#žk= 


2|; 
nl; 


Соу (X, Xs | 
А 
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Problemas Suplementares 


DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS 


549. 


5,52. 


5.53. 


5.54. 


5.55, 


5.56. 


Uma população consiste dos quatro números 3, 7, 11, 15. Consideremos todas as amos- 
tras de tamanho dois, com reposição, que se podem extrair dessa população. Deter- 
mine (a) a média da população, (5) o desvio padtão da população, (c) a média de distri- 
buição amostral de médias, (d) o desvio padrão da distribuição amostral de médias. 
Verifique (c) e (d) diretamente a partir de (a) e (b), utilizando fórmulas adequadas. 


. Resolva o Problema 5.49 no caso de amostragem sem reposição. 


. Os pesos de 1.500 mancais têm distribuição normal com média 22,40 oz. e desvio padrão 


0,048 oz. Extraindo-se desta população 300 amostras de tamanho 36, determine a média 
€ o desvio padrão esperados para a distribuição amostral de médias, no caso de amostra- 
gem (a) com reposição, (b) sem reposição. 


Resolva o Problema 5.51 no caso de a população consistir de 72 mancais. 


No Problema 5.51, quantas amostras teriam suas médias (a) entre 22,39 e 22,41 oz., (b) 
acima de 22,42 oz., (c) abaixo de 22,37 oz., (d) abaixo de 22,38 oz. ou acima de 


22,41 022 


Certas válvulas fabricadas por uma companhia acusam vida média de 800 horas e desvio 
padrão de 60 horas. Determine a probabilidade de uma amostra aleatória de 16 válvulas 
acusar vida média (2) entre 790 e 810 horas, (b) de menos de 785 horas, (c) de mais de 
820 horas, (d) entre 770 e 830 horas. 


Faça o Problema 5.54 no caso de uma amostra aleatória de tamaho 64. Explique a 
diferença. 


Os pesos dos pacotes recebidos por um departamento de determinada empresa acusam 
média de 300 lbs, e desvio padrão de 50 Ibs. Qual a probabilidade de 25 pacotes escolhi- 
dos ao acaso e colocados em um elevador, excederem o limite de segurança deste, fixado 
em 8.200 lbs.? 


DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES 


5.57. 


5.58. 


5.59, 


Determine a probabilidade de que, das próximas 200 crianças a nascerem, (a) menos de 
40% sejam meninos, (b) entre 43%e 57% sejam meninas, (c) mais de 54% sejam meninos. 
Admita probabilidades iguais de nascimento para menino ou menina. 


De 1.000 amostras de 200 crianças cada uma, em quantas poderíamos esperar encontrar 
(a) menos de 40% meninos, (b) entre 40% e 60% meninas, (c) 53% ou mais meninas? 


Faça o Problema 5.57 considerando 100 crianças ao invés de 200, e explique a diferença. 
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5.60, 


5.61. 


5.62. 


Uma urna contém 80 bolas, das quais 60% são vermelhas e 40% brancas. Extraídas 50 
amostras de tamanho 20 cada uma, com reposição, em quantas amostras poderíamos 
esperar (a) iguais quantidades de vermelhas e brancas, (5) 12 bolas vermelhas e 8 brancas, 
(c) 8 vermelhas e 12 brancas, (d) 10 ou mais brancas? 


Planeje um experimento destinado a ilustrar os resultados do Problema 5.60. Em lugar de 
bolas vermelhas e brancas, poder-se-ão utilizar pedaços de papel com as letras V e B, nas 
proporções adequadas. Que erros poderiam ser introduzidos com a utilização de dois 
conjuntos diferentes de moedas? 


Um fabricante despacha 1.000 lotes de 100 lâmpadas elétricas cada um. Se 5% das 
lâmpadas são normalmente defeituosas, em quantos lotes poderíamos esperar (a) menos 
de 90 lâmpadas boas, (b) 98 ou mais lâmpadas boas? 


DISTRIBUIÇÃO AMOSTRAL DE DIFERENÇAS E DE SOMAS 


5.63. 


5.64. 


5.65. 


5.66. 


5.67. 


5.68. 


5.69. 


5.70. 


5.71. 


A e B fabricam dois tipos de cabos, com resistência média de 4.000 e 4.500 165. e desvios 
padráo de 300 e 200 lbs., respectivamente. Testando-se 100 cabos da marca A e 50 da 
marca B, qual a probabilidade de a resisténcia média de B ser (a) ao menos 600 lbs. mais 
que a de 4, (b) ao menos 450 lbs. mais que a de 4? 


Quais as probabilidades no Problema 5.63 no caso de serem testados 100 cabos de cada 
marca? Justifique as diferengas. 


O escore médio de aptidão dos estudantes submetidos a um teste é de 72 pontos, com 
desvio padrão de 8 pontos. Qual a probabilidade de que dois grupos de 28 e 36 estudan- 
tes respectivamente, difiram em seus escores médios (2) por 3 ou mais pontos, (b) por 6 
ou mais pontos, (c) entre 2 с 5 pontos? 


Uma urna contém 60 bolas vermelhas e 40 brancas. Extraem-se da uma dois conjuntos 
de 30 bolas cada, com reposição, anotando-se as cores que ocorrem. Qual a probabilida- 
de de os dois conjuntos diferirem entre si por 8 ou mais bolas vermelhas? 


Resolva o Problema 5.66 no caso de ser utilizada amostragem sem reposição para a 
obtenção dos dois conjuntos. 


Os resultados de uma eleição acusam 65% dos votos em favor de determinado candidato. 
Determine a probabilidade de que duas amostras aleatórias, cada uma de 200 eleitores, 
acusem diferença superior a 10% nas proporções de votos em favor do candidato. 


Se U, е U; são os conjuntos de números do Problema 5.12, verifique que 


= + ex 2 2 
(a) toro, Sto © Hup 6) oyu, — YU, TAN 


Calculam-se três pesos, obtendo-se os resultados 20,48, 35,97 e 62,34 Ibs., com desvios 
padrão 0,21, 0,46 e 0,54 lbs., respectivamente. Determine (a) a média, (b) o desvio 
padrão da soma dos pesos. 


A voltagem média de uma bateria é 15,0 volts, com desvio padrão de 0,2 volts. Qual a 
probabilidade de quatro dessas baterias, ligadas em série, terem uma voltagem combina- 
da de 60,8 ou mais volts? 
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DISTRIBUIÇÃO AMOSTRAL DE VARIÁNCIAS 


5.72. 


5.73. 


5.75. 


Com referência ao Problema 5.49, determine (a) a média da distribuição amostral de 
variâncias, (b) o erro padrão das variâncias. 


Faça o Problema 5.72 no caso de amostragem sem reposição. 


. Uma população normal tem variância 15. Extraindo-se dessa população amostras dó 


tamanho 5, que percentagens podemos esperar com variâncias (2) inferiores a 10, (b) su- 
periores a 20, (c) entre 5 e 10? 


A vida média das válvulas de televisão fabricadas por determinada companhia é de 
2.000 horas, com desvio padráo de 60 horas. Escolhidas 10 válvulas ao acaso, determine 
a probabilidade de o desvio padrão amostral (a) não exceder 50 horas, (b) estar entre 
50 e 70 horas. 


CASO EM QUE NÃO SE CONHECE 
A VARIÂNCIA DA POPULAÇÃO 


5.76. 


Conforme a tábua da distribuição г de Student para 1 grau de liberdade (Apéndice D), 
temos P(-1<T<1) = 0,50. Verifique sé os resultados do Problema 5.1 são 
confirmados por este valor, e explique as diferenças que ocorrem. 


. Verifique se os resultados do Problema 5.49 são confirmados utilizando-se 


(а) Р(-1<Т<1) = 0,50, (b) P(-1,376 <T <1,376) = 0,60, 
onde T tem distribuição f de Student сот r = 1. 


„ Explique como utilizaria o Teorema 5-7, pág. 226, para Construir uma tábua de distribui- 


ção t de Student tal como a constante do Apéndice D. 


DISTRIBUIÇÃO AMOSTRAL DE RAZÕES DE VARIÁNCIAS 


5.79. 


De uma população normalmente distribuída extraem-se duas amostras de tamanhos 4 e 
8. A probabilidade de uma variância ser mais de 1,5 vezes a outra é maior que 0,05, me- 
nor que 0,01 ou está entre 0,05 e 0,012 


. Duas Companhias, A e B, fabricam lâmpadas. A vida média das lâmpadas de 4 tem des- 


vio padrão de 40 horas, enquanto que a vida média das de B têm desvio padrão de 50 
horas. Extrai-se uma amostra de 8 lâmpadas de A e 16 lâmpadas de B. Determine a 
probabilidade de a variância da primeira amostra ser (a) mais do dobro, (b) 1,2 vezes 
a variância da primeira. 


. Faça o Problema 5.80 se os desvios padrão das vidas médias são (a) ambos de 40 horas, 


(b) ambos de 50 horas. 


Mid lc ire 


m 
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DISTRIBUICÁO DE FREQÜÉNCIA 


5.82. 


5.83, 


5.84. 


5.85. 


5.86. 


5.87. 


A Tábua 5-17 dá a distribuição da freqü&ncia da vida média de 400 válvulas de rádio tes- 
tadas na L & M Tube Co. Determine (a) o limite superior da quinta classe, (5) o limite 
inferior da oitava classe, (c) o ponto médio de sétima classe, (d) as fronteiras da última 
classe, (є) a amplitude do intervalo de classe, (f) a frequência da quarta classe, (g) а 
fregiiência relativa da sexta classe, (h) percentagem das válvulas cuja vida média não ex- 
cede 600 horas, (1) percentagem das válvulas cuja vida média é igual ou superior a 900 
horas, (7) percentagem das válvulas cuja vida média é no mínimo de 500 horas porém 
inferior a 1.000 horas. 


Tábua 5-17 


Vida Média 
(horas) 


300 — 399 
400 — 499 
500 — 599 
600 — 699 
700 — 799 
800 — 899 
900 — 999 
1.000—1.099 
1.100—1.199 


Construa (а) um histograma, (b) um polígono de fregüéncia correspondente à distribui- 
ção de fregiiência do Problema 5.82. 

Para os dados do Problema 5.82, construa (a) uma distribuição de freqüóncias relativas 
(percentagens), (b) um histograma de frequências relativas, (c) um polígono de freguên- 
cias relativas. 

Para os dados do Problema 5.82, construa (а) uma distribuição de frequência acumula- 
da, (b) uma distribuição de percentagens (frequências relativas), acumuladas, (c) uma 
ogiva, (d) uma ogiva de percentagens. 

Estime a percentagem de válvulas no Problema 5.82 cuja vida média é (a) inferior a 
560 horas, (b) igual ou superior a 970 horas, (c) compreendida entre 620 e 890 horas. 


Os diâmetros interiores das arruelas fabricadas por determinada companhia podem ser 
medidos a menos de um milésimo de polegada. Se os pontos médios de uma distribui- 
ção de freqüéncia desses diâmetros são dados em polegadas por 0,321, 0,324, 0,327, 
0,330, 0,333 e 0,336, determine (a) a amplitude do intervaio de classe, (b) as frontei- 
ras de classe, (c) os limites de classe. 


5.88, 


0,738 
0,728 
0,745 
0,733 
0,735 
0,732 


5.89. 


5.90. 


5.91. 
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A Tábua 5-18 dá os diâmetros de uma amostra de 60 mancais fabricados por certa 
Companhia. Construa uma distribuição de frequência dos diámetros, utilizando interva- 
los de classe adequados. 


Tábua 5-18 
0,729 0,743 0740 0,736 0,741 0,735 0731 0,726 0,787 
0,737 0,736 0,735 0,724 0,788 0,742 0,736 0,789 0,735 
0.736 0,742 — 0.740 0,728 0,788 0,725 0,783 0,784 0,732 
0,730 0,732 0,780 0,789 0,784 — 0,788 0,789 0,727 0,735 
0,732 0,785 отт 0,134 0,788 0,786 0,741 0,736 0,744 
0,737 0,731 0746 0,735 0,7358 0,729 0,7384 0,780 0,740 


Para os dados do Problema 5.88, construa (a) um histograma, (b) um polígono de 
freqüéncia, (c) uma distribuição de fregiiência relativa, (d) um histograma de fregiiên- 
cia relativa, (e) um polígono de freqüéncia relativa, (f) uma distribuição de frequência 
acumulada, (g) uma distribuição percentual acumulada, (й) uma ogiva, (i) uma ogiva 
percentual. 


Com base nos resultados do Problema 5.89, determine a percentagem de mancais com 
diámetro (д) que excedem 0,732 polegadas, (b) que não superam 0,736 polegadas, 
(c) que estão entre 0,730 e 0,738 polegadas. Compare seus resultados com os obtidos 
diretamente dos dados brutos da Tábua 5-18. 


Faça o Problema 5.89 para dos dados do Problema 5.82. 


CÁLCULO DA MÉDIA, DO DESVIO PADRÁO 
E DOS MOMENTOS DE AMOSTRAS 


. Um estudante obteve as notas 85,76,93,82 e 96 em cinco disciplinas. Determine a média 


aritmética das notas. 


. Os tempos de reação de um indivíduo a certos estímulos, medidos por um psicólogo, sáo 


0,53, 0,46, 0,50, 0,49, 0,52, 0,53, 0,44 e 0,55 segundos, Determine o tempo médio de 
reação do indivíduo aos estímulos. 


. Um conjunto de números consiste de seis 6, sete 7, oito 8, nove 9 e dez 10, Qual a média 


artmética dos números? 


. As notas de um estudante em prática de laboratório, teoria e sabatina em um curso de 


física são 71, 78 e 89, respectivamente. (2) Se os pesos atribuídos a essas notas sáo 2, 4 
e 5 respectivamente, qual a nota média? (b) Qual a nota média no caso de serem atribuí- 
dos pesos iguais? 


Trés professores de economia reportaram as médias de 79, 74 e 82 em suas classes, que 
consistiam de 32, 25 e 17 alunos, respectivamente. Determ a nota média conjunta de 
todas as classes. 
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5.97. O salário médio anual pago a todos os empregados de uma firma foi de $ 5.000. Os sa- 
lários médios anuais de homens e de mulheres foram de $ 5.200 e $ 4.200, respectiva- 
mente. Determine as percentagens de homens e de mulheros empregados pela firma. 


5.98. A Tábua 5-19 dá a distribuição de cargas máximas em toneladas de 2.000 lbs. suportadas 
pelos cabos fabricados por determinada Companhia. Determine a carga máxima utilizan- 
do (a) o método “longo”, (b) o método abreviado, 


Tábua 5-19 
Carga máxima Nº de cabos 
(0 
9,3— 9,7 2 
9,8—10,2 5 
10,3—10,7 12 
10,8—11,2 17 
11,8-11,7 14 
11,8-12,2 6 
12,8-12,7 3 
12,8-13,2 1 
TOTAL [e] 


5.99. Determine x para os dados da Tábua 5-20 usando (a) o método “longo”, (b) método 
abreviado. 


Tábua 5-20 
æ | d62 480 498 516 534 552 570 588 606 624 
f|98 75 56 42 30 21 15 11 6 2 
5.100. A Tábua 5-21 dá a distribuição dos diâmetros das cabeças de rebites fabricados por deter- 
minada companhia. Calcule o diâmetro médio. 


Tábua 5-21 


Diâmetro (pols.) Freqüéncia 
0,7247—0,7249 
0,7250—0,7252 6 
0,7253—0,7255 8 
0,7256—0,7258 15 
0,7259—0,7261 42 
0,7262—0,7264 68 
0,7265—0,7267 49 
0,7268—0,7270 25 
0,7271-0,7273 18 
0,7274—0,7276 12 
0,7271—0,7279 
0,7280—0,7282 
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Tábua 5-22 


10 / menos de 15 


15 / menos de 20 
20 / menos de 25 


25 / menos de 30 


30 / menos de 35 
35 / menos de 40 
40 / menos de 45 


5.101. Calcule a média dos dados da Tábua 5-22. 


5.102. Determine o desvio padrão dos números: (а) 3, 6, 2, 1, 7, 5; (b) 3,2, 4,6, 2,8, 5,2 4,4; 
(c) 0, 0, 0, 0, 0, 1, 1, 1. 


5.103. (a) Somando-se 5 a cada um dos números do conjunto 3, 6, 2, 1, 7, 5, obtemos o conjun- 
to 8, 11, 7, 6, 12, 10. Mostre que os dois conjuntos têm o mesmo desvio padrão mas 
médias diferentes. Qual a relação entre as duas médias? 


(b) Multiplicando cada um dos números 3,6,2,1,7,5 por 2e somando-se 5 а cada um, 
obtemos o conjunto 11, 17, 9, 7, 19, 15. Quais as relações entre as médias e os 
desvios padrão dos dois conjuntos? 


(c) Que propriedades da média e do desvio padrão são ilustradas pelos conjuntos de nú- 
meros de (а) e (b)? 


5.104. Determine o desvio padrão do conjunto de números da progressáo aritmética 4, 10, 16, 
22, ..., 154, 


5.105. Determine os desvios padrão das distribuições (a) do Problema 5.98, (р) do Problema 
5.99. 


5.106. Determine (a) a média, (b) o desvio padrão da distribuição do Problema 5.30, explican- 
do o significado dos resultados obtidos. 


5.107. (a) Determine o desvio padráo s dos diámetros de rebites do Problema 5,100. (b) Que 
percentagem de diámetros está compreendida entre (2 = в), (2 +28), (# + 3s)? 
(e) Compare as percentagens em (b) com as que seriam teoricamente esperadas se a dis- 
tribuição fosse normal, e comente as diferenças observadas. 
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5.108. (a) Determine média e desvio padráo para os dados do Problema 5.28. (b) Construa uma 
distribuição de frequência dos dados e ache o desvio padrão. (c) Compare o resultado de 
(b) com o de (a). 


5.109. Faga o Problema 5.108 para os dados do Problema 5.88. 


5.110. (a) De um total de n números, psão 1 -eg = 1 —p são 0 ·. Prove que o desvio padrão 
do conjunto de números é Vpq. (b) Aplique o resultado а (a) do Problema 5.102(c). 


5.111. Determine (a) o 19, (b) o 29, (c) o 39 e (d) o 42 momento em relação à origem do 
conjunto de números 4, 7,5,9,8,3,6. 


5.112, Determine (a) o 19 , (b) o 29, (c) o 39 e (d) o 49 momento em relação à média do 
conjunto de números do Problema 5.111. 


5.113 Determine (a) o 19, (5) o 29, (c) o 39 e (d) o 49 momento em relação ao número 7 
para o conjunto de números do Problema 5.111. 


5.114. Utilizando os resultados dos Problemas 5.111 e 5.112, verifique as sevuintes relações 
entre os momentos: (a) ms = mi— mj”, (b) mg = mj— Bm mó 3 


Er 
(0) ma = m4 — 4mtmá + 6m m3 — 3m[*. 


5.115, Determine os quatro primeiros momentos em relação à média para o conjunto de nüme- 
10s da progressáo aritmética 2, 5, 8, 11, 14, 17. 


5.116.Se o primeiro momento em relação ao número 2 é igual a 5, qual é a média? 


5.117.Se os quatro primeiros momentos em relagáo ao número 3, de um conjunto de números, 
são —2, 10, —25 e 50, determine os momentos correspondentes (a) em relação à média, 
(b) em relação ao número 5, (c) em relação a zero. 


5.118, Determine os quatro primeiros momentos em relação à média, para os números 0,0, 0, 
11,11, 1. 


5.119. (a) Prove que mg = mi — bmi m4 + 10m; ms — 10т Pm, + Am. (Б) Deduza uma 
fórmula análoga para mg. 


5.120. De um total de п números, a fração p consiste de 1 , e a fracio q = 1 — p consiste de 
0 . Determine (a) m, (b) mo, (c) my e (d) т, рага о conjunto de números. 
Compare com o Problema 5.118. 


5.121.Calcule os quatro primeiros momentos em relação à média para a distribuição da Tábua 
5-23. 


5.122, Calcule os quatro primeiros momentos em relação à média para a distribuição do Proble- 
ma 5,98. 

5.123. Determine (а) my, (Б) mo, (с) my, (d) m4, (е) 2, (F) s, (g) x3, (13,13, e 
(j) (+ DP. para a distribuição do Problema 5.101. 
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Tábua 5-23 
v f 
12 i 
14 4 
16 6 
18 10 
20 ri 
22 2 
TOTAL 30 


5.124, Determine os coeficientes (а) de assimctria, (b) de kurtosis para a distribuição do Proble- 
ma 5.121 


5.125. Determine os coeficientes (a) de assimetria, (b) de kurtosis para a distribuição do Proble- 
ma 5.98. V. Problema 5.122. 


5.126. Оз momentos de ordem dois em relação à média, para as duas distribuições, são 9 e 16, 
enquanto que os momentos de ordem três em relação à média: são —8,1 e —12,8, res- 
pectivamente, Qual das distribuições é mais assimétrica à esquerda? 


5.127. Оз momentos de ordem quatro em relação à média, para as duas distribuições do Proble- 
ma 5.126 são 230 e 780, respectivamente. Qual das duas distribuições mais se aproxima 
da normal do ponto de vista (a) do achatamento, (b) da assimetria? 


PROBLEMAS DIVERSOS 


5.128. Uma população de 7 números tem média 40 e desvio padrão 3. Extraindo-se amostras de 
tamanho 5 dessa população e calculando-se o desvio padrão de cada amostra, determine a 
média da distribuição amostral de variáncias no caso de amostragem (a) com reposição, 
(b) sem reposição. 


5.129. Certas válvulas fabricadas por uma companhia têm vida média de 900 horas e desvio pa- 
áráo de 80 horas. A companhia despacha 1.000 lotes de 100 válvulas cada. Em quantos 
lotes podemos esperar (2) vida média superior a 910 horas, (b) desvio padrão das vidas 
superior a 95 horas? Que hipóteses devemos fazer? 


5.130. Se, no Problema 5.129, a vida mediana é de 900 horas, em quantos lotes podemos espe- 
rar vida mediana superior a 910 horas? Compare a resposta com o Problema 5.129) e 
explique os resultados. 


5.131. Em determinada cidade, as notas de um exame oficial acusaram média 72 e desvio 8. 
(a) Determine а nota mínima dos primeiros 20% de estudantes. (Б) Determine a probabi- 
lidade de que, em uma amostra aleatória de 100 desses estudantes, a nota mínima dos 
primeiros 20% seja inferior a 76. 


"т 
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5.132. (a) Prove que a variância do conjunto de п números a, a +d, a+2d,..,at(n-1)d 
(isto é, uma progressão aritmética com primeiro termo a e razão d) é dada por 


En Dd. 

(Sugestão: Tenha em conta que 1 +2 +8 +: +(n—1) 

= ni — 1), 124224324 >> + (n—19 = 4n(n— 1)(2n — 1)] 
(b) Use (a) no Problema 5.104. 


5.133. Prove que os quatro primeiros momentos em relação à média, da progressão aritmética 
а, а+ а, а+2 а + (п – Id, são 


= L 


тү =й, m = е-е, ту = 0, т = туу 


(02 — 1)(8n2 — 7)d4 
Compare com o Problema 5.115. 
(Sugestão: 15 + 24+ 34+ ++" +(n—1)*= эп — 1)2n — 1)882 — 3n— 1).] 
5.134. Extraise de uma população uma amostra aleatória de 8 observações. Qual a probabilida- 
de de as três primeiras observações serem superiores ás cinco últimas? 


5.135. Prove que V, e V, tais como definidas no Problema 5.22, pág. 246, são independentes. 


5.136. Prove o resultado (19), página 225. 


capítulo 6 


Teoria da Estimação 


ESTIMATIVAS NÃO-TENDENCIOSAS E ESTIMATIVAS EFICIENTES 


Como dissemos no Capítulo 5, uma estatística é chamada estimador não- 
tendencioso de um parâmetro populacional se sua média, ou esperança, for igual 
20 parâmetro. O valor correspondente da estatística chama-se então estimativa 
não-tendenciosa do parámetro. 


EXEMPLO 6.1. A média X e a variância 32 tais como definidas nas páginas 221 e 225, são 
simadores não-tendenciosos da média 4 e da variância 07, pois EX) = = ES?) = 
res E e $7? são então estimativas não-tendenciosas. Entretanto S é, na realidade, um esti- 


=ador tendencioso de O, pois em geral E(5) + 0 


Se as distribuições amostrais de duas estatísticas têm a mesma média, a esta- 
ica que apresenta menor variância é chamada estimador eficiente da média. O 
or correspondente da estatística eficiente é então uma estimativa eficiente. 
Obviamente, na prática, devem preferir-se estimativas que são ao mesmo tempo 


jentes e não-tendenciosas, mas isto nem sempre é possível. 


EXEMPLO 6.2. As distribuições amostrais da média e da mediana têm ambas a mesma média, 
= saber, a média da população. Entretanto, a variância da distribuição amostral das médias é 
зот que a variância da distribuição amostral das medianas. A média é, pois, uma estimativa 
s eficiente do que a mediana. V. Tábua 5-1, pág. 227. 


Na prática, utilizam-se frequentemente estimativas tendenciosas ou ineficien- 
m razão da facilidade com que são obtidas. 
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ESTIMATIVAS PONTUAIS E ESTIMATIVAS 
POR INTERVALOS. CONFIABILIDADE. 


Uma estimativa de um parâmetro populacional dada por um único número é 
chamada estimativa pontual do parâmetro. Uma estimativa de um parâmetro 
populacional dada por dois números, entre os quais o parâmetro deve estar situado, 
é chamada estimativa por intervalo do parâmetro. 


EXEMPLO 6.3. Se dizemos que uma distância é de 5,28 pés, estamos dando uma estimativa 
pontual. Se, por outro lado, dizemos que a distância é de 5,28 + 0,03 pés, isto é, a distância 
deve estar compreendida entre 5,25 e 5,31 pés, temos uma estimativa por intervalo. 


Uma indicação do erro, ou da precisão, de uma estimativa costuma chamar-se 
confiabilidade. 


ESTIMATIVAS POR INTERVALO DE CONFIANÇA 
DE PARAMETROS POPULACIONAIS 


Sejam pç e © a média e o desvio padrão (erro padrão) da distribuição amos- 
tral de uma estatística S. Então, se a distribuição amostral de S é aproximadamente 


normal (o que, como vimos, é verdadeiro para muitas estatísticas desde que и > 30, 
é lícito esperar que 5 esteja compreendido nos intervalos 


usos а му To ру 205 а pg +20, ou 157305 a ng +30 


em cerca de 68,27%, 95,45% e 99,73% das vezes, respectivamente. 
Equivalentemente, podemos esperar encontrar, ou estar confiantes em encon- 
trar ^g nos intervalos 
6—0; a Stop 8-29, a 5 +20; ош S— 30g а S + 3o, 
em cerca de 68.27%, 95,45% e 99,73% das vezes, respectivamente. Em razüo 
disto, referimo-nos a esses intervalos como os intervalos de confiança de 68,27%, 
95,45% ou 99,73% para estimativa de u, (L.e., para estimar o parâmetro populacional 
no caso de 5 ser não-tendencioso). Os extremos desses intervalos (S + sg, S +20,, 
S+3o,) são os limites de confiança de 68,27%, 95,45% ou 99,73%, respectiva- 
mente. 
Analogamente, 5 = 1,960, e S + 2,580, são limites de confiança de 
95% е 99% (ou 0,95 e 0,99) para mg. А percentagem de confiança costuma cha- 
mar-se nível de confiança. Os números 1,96, 2,58, etc., nos limites de confiança 
são chamados coeficientes de confiança ou valores críticos, e se denotam por zc. 
A partir dos níveis de confiança podemos determinar coeficientes de confiança, e 
reciprocamente. 
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Na Tábua 6-1 damos valores de zc correspondentes a vários níveis de confian- 
ca utilizados na prática. Para níveis de confianga náo constantes da Tábua, podemos 
determinar os valores de zc a partir da tabela de áreas sob a curva normal (Apéndice 
C). 


Tábua 61 
Nivel de Confiança 99,73% 99% 98% 965 95,45% 955 90% 80% 68,27% 50% 


E 


A 300 2,58 233 205 200 196 1,645 128 100 0,6745 


Nos casos em que uma estatística tem distribuição amostral diferente da dis- 
tribuição normal (tais como a qui-quadrado, г ou FF), podem-se introduzir facilmen- 
te modificações apropriadas para obter os intervalos de confiança. 


INTERVALOS DE CONFIANÇA PARA MÉDIAS 
1. Grandes Amostras (n > 30). 


Se a estatística S é a média amostral X, então os limites de confiança de 95% 
е 99% para estimação da média u da população são dados por X + 1,960; е 
X = 2,58 v; respectivamente. Mais geralmente, os limites de confiança são dados 
por X +z ox onde ze — que depende do particular nível de confiança desejado — 
pode ser lido na tábua acima. Utilizando os valores de vz obtidos no Capitulo 5, 


vemos que os limites de confiança para a média da população são dados por 

Y += go r. 

i (2) 
no caso de amostragem de uma população infinita ou amostragem com reposição 
de uma população finita; e por 

X ue pus 
2 em 


no caso de amostragem sem reposição de uma população finita de tamanho N. 
Em geral não se conhece o desvio padrão o da população, de modo que, para 
obter os limites de confiança acima, utilizamos o estimador 5 ou S. 


2. Pequenas amostras (n < 30). 


Neste caso utiliza-se a distribuição r para obter níveis de confiança. P. ex., 
se —£975 € gas sio os valores de Т para os quais 2,5% da área estão situados em 
cada cauda da distribuição £, então um intervalo de confiança de 95% para T é 
dado por (v. página 226). 


276 PROBABILIDADE E ESTATÍSTICA 


— bopis < < loeis (3) 


(X - vn 
© 


donde se vé que se pode estimar p situado no interyalo 


OS > 8 
X -ton = < m < É MULT (4) 
com 95% de confiança. Em geral, os limites de confiança para médias populacio- 
nais são dados por 


£o. (8) 
va 
onde os valores te se encontram na tábua do Apéndice D. 

A comparação de (5) com (1) indica que, para pequenas amostras, substitui- 
se 2, por tp. Para n > 30, Z, èt, são praticamente iguais. Note-se que a vantagem 
da teoria das pequenas amostras (que pode, naturalmente, aplicar-se também a 
grandes amostras é que comparece em (5), de modo que se pode usar o desvio 
padrão amostral em lugar do desvio padrão da população (em geral desconhecido), 
como em (1). 


INTERVALOS DE CONFIANÇA PARA PROPORÇÕES 


Seja a estatística S a proporção de “sucessos” em uma amostra de tamanho 
n> 30 extraída de uma população binomial em que p é a proporção de sucessos 
(44, a probabilidade de sucesso). Então, os limites de confiança para p são dados 
por Ps, onde P denota a proporção de sucessos na amostra de tamanho n. 
Usando os valores de op obtidos no Capítulo 5, vemos que os limites de confiança 
para a proporção da população são dados por 


Р = ра . IPod р(1—р) (6) 
n \ т 


no caso de amostragem de uma população infinita, ou amostragem com reposição 
de uma população finita. Analogamente, os limites de confiança são 


+ 2 Im [Non е 
PRA SAP т (7) 


se a amostragem é sem reposição, de uma população finita de tamanho N. Note-se 
que tais resultados se obtêm de (1) e (2) substituindo X porPeopor vpa. 

Para o cálculo dos limites de confiança acima utilizamos a estimativa amostral 
P para p. O Problema 6.27 dá um método mais exato. 
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INTERVALOS DE CONFIANÇA PARA DIFERENÇAS E SOMAS 


Se S, eS, são duas estatísticas amostrais com distribuições aproximadamente 
normais, a expressão 


S,— 8, E 2,05, в, = S,—8,+2,V03, + v, (8) 
dá limites de confiança para as diferenças dos parámetros populacionais correspon- 
dentes a S, e Sz, enquanto que a expressão 


S, +8, + 2,0558, = S, HS, ERV 03, +05, (9) 
dá limites de confianga para a soma dos parámetros populacionais, desde que as 


amostras sejam independentes. 
Por exemplo, no caso de populações infinitas, a expressão 


2 2 
5 a ої оў 


XX, e „ = ER, RA qa (10) 
dá limites de confiança para a diferença de duas médias populacionais onde 


X, 0,1, е X, os п, são as respectivas médias, desvios padrões e tamanhos 
das duas amostras extraídas das populações. 


Analogamente, 


-P + = 
P, B, = epi — PS 


dá limites de confiança para a diferença de duas proporções de populações (infini- 
tas). P, e P, são as duas proporções amostrais, п, € 7, SãO 05 tamanhos das duas 
amostras extraídas das populações e p, e рз são as proporções nas duas popula- 
ções (estimadas por intermédio de P, e P, $ 


INTERVALOS DE CONFIANÇA PARA VARIÂNCIAS 


O fato que 752/02 =(n—1)8*/0* tem distribuição qui-quadrado com 

n — 1 graus de liberdade permitem obter limites de confiança para о? ou о. P. ex., 

Xion © оле SãO os valores de x^ para os quais 2,5% da área correspondem a 

cada “cauda” da distribuição, então um intervalo de confiança de 95% é dado por 
ns? 

ms < з $ 38.975 (12) 


ou equivalentemente 


pas < Су E Жөн (13) 
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Dessas expressões vemos que se pode estimar o situado no intervalo 


Syn És а Syn (14) 
X0,975 Xop25 


ou equivalentemente 
Syn-1 (15) 


Syni А 


Хоэтѕ Хою25 


com 95% de confiança. De modo análogo, podem-se obter outros intervalos de 
confiança. 

De modo geral, é desejável que a amplitude de um intervalo de confiança 
seja a menor possível. No caso de estatísticas com distribuição amostral simétrica, 
tais como as distribuições normal e £, consegue-se isto utilizando caudas de áreas 
iguais. Todavia, para distribuições náo-simétricas, tais como a qui-quadrado, pode 
ser conveniente ajustar as áreas nas caudas de forma a obter o menor intervalo 
possível. O Problema 6.28 ilustra o processo. 


INTERVALOS DE CONFIANÇA PARA RAZÕES DE VARIÂNCIA 


No Cap. 5. pág. 228, vimos que se duas amostras aleatórias independentes, de 
tamanhos т e n, com variâncias Si, S2 são extraídas de duas populações normal- 
mente distribuídas com variâncias оў, c2 respectivamente, então a variável alea- 


2 
tória E, 
ria Sua 
Sis 
tem distribuição F com m — 1, n — 1 graus de liberdade. Assim, p.ex., se denota- 


mos por Foy, е Fog os valores de F para os quais 1% da área está em cada cauda 
da distribuição F, então, com 98% de confiança, temos 


Silo 
Fon € A. X Fogo (16) 
53/05 
Deste resultado vemos qué * * " 
AS с а 15 ar) 
Fogo 82 o Fom$r 


nos dá um intervalo de confiança de 98% para a razáo de variáncias 0/0 das 
duas populações. 

Note-se que o valor de Fogy pode ser lido em uma das tábuas do Apéndice F. 
O valor de Fop é recíproco de Fogg com os graus de liberdade do numerador e do 
denominador trocados entre si, conforme Teorema 4-8, pág. 168. 

De modo análogo poderíamos determinar um intervalo de confiança de 90% 
utilizando a tábua apropriada do Apêndice F. Teríamos então 
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< 15 (18) 


ESTIMATIVAS DE MÁXIMA VEROSSIMILHANCA 


Conquanto os limites de confiança constituam elementos valiosos para esti- 
mar um parámetro populacional, é conveniente dispormos também de uma estimati- 
va pontual. A “melhor” estimativa pontual se obtém empregando uma técnica 
conhecida como a estimariva de máxima verossimilhanca, devida a Fisher. 

Para ilustrar o método, supomos que a população tenha função de densidade 
que contenha um parâmetro populacional, digamos 0, a ser estimado por meio de 
determinada estatística. Então, a função de densidade pode ser denotada por ff x, 0). 
Admitindo que haja m observações independentes, X,, Ж», ..‚ Xy, a função de 
densidade conjunta para essas observações é 

L = f(2:,0) f(22,0): + -f( 9) (19) 
que é chamada verossimilhança A máxima verossimilhança pode ser então obtida 
tomando-se a derivada de L em relação а 6 e igualando-a a zero. Para isto, é conve- 
niente primeiro tomar logaritmos e então derivar. Assim, pois 

1 af(as,0) 1  of(r,0) 
fm a tovt Fen 0) 80 g (20) 
Desta equação podemos obter 0 em termos dos xg. 

O método é passível de gencralização. Assim, no caso de vários parâmetros, 
tomam-se as derivadas parciais em relação a cada um deles e, igualando-as a zero, 
resolve-se o sistema decorrente. 


Problemas Resolvidos 


ESTIMATIVAS NAO—TENDENCIOSAS E EFICIENTES 


6.1. Dé exemplo de estimadores (ou estimativas) que sejam (a) não-tendenciosos e 
eficientes, (b) não-tendenciosos e não-eficientes, (c) tendenciosos e não-efi- 
cientes. 
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(a) A média amostral X e a variância amostral modificada 


з= Lg 


(b) A mediana amostral e a estatística amostral 3(Q, + ©з), onde Q; e 03 são os quar- 
tis amostrais inferior e superior. Ambas as estatísticas são estimativas não-tendenciosas 
da média da população, pois a média de suas distribuições amostrais é igual à média da 


população. Todavia, comparadas com X. ambas se revelam ineficientes. 


(c) O desvio padrão amostral S, o desvio padrão modificado S, o desvio médio e o inter- 
valo semi-interquartil. 


6.2. Em uma amostra de cinco medidas do diámetro de uma esfera foram registra- 
dos os valores 6,33, 6,37, 6,36, 6,32 e 6,37 centímetros. Determine estima- 
tivas não-tendenciosas e eficientes (a) para a verdadeira média, (b) para a verda- 
deira variância. 


(a) Uma estimativa náo-tendenciosa e eficiente da verdadeira média (i.e., da média da po- 
pulação) é dada por 


g = Et = 6,32 + 6,87 + 6,36 + 6,82 + 6,87 _ 
= 4 E E = 
(b) Uma estimativa não-tendenciosa e eficiente da verdadeira variância (i.c., da variância 


da população) é dada por 


6,35 em 


^2 n 3 (a — zy 
» gei” »—1 
(6,33 — 6,85)? + (6,37 — 6,85)? + (6,36 — 6,35)? + (6,32 — 6,85? + (6,37 — 6,35)? 


$1 


= 0,00055 em? 


Note que $= V0,00055 = 0,028 também é uma estimativa do desvio padrão, 
mas essa estimativa não é nem não-tendenciosa nem eficiente. 


6.3. Suponha que as alturas de 100 estudantes do sexo masculino da Universidade 
XYZ constituam uma amostra aleatória das alturas dos 1.546 estudantes de 
sexo masculino da universidade. Determine estimativas não-tendenciosas e efi- 
cientes para (a) a verdadeira média, (b) a verdadeira variância. 


(a) Do Problema 5.33: 
Estimativa não-tendenciosa e eficiente da média = Ў = 6745" 


(b) Do Problema 5.38: 
Estimativa náo-tendenciosa e eficiente da variáncia 
аа = 100% мар 
5-15 yy (8,5275) = 8,6186 
Assim, $ = у8,6186 = 2,98. Note-se que, como п é grande, não há essencial- 
mente diferença entre s? e 820u entre s e 3. 


"- y 
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6.4, Dê uma estimativa não-tendenciosa e ineficiente do verdadeiro diâmetro (mé- 
dio) da esfera do Problema 6.2. 


A mediana é um exemplo de estimador não-tendencioso porém ineficiente da 
média da população. Para as cinco medidas dispostas em ordem de grandeza, a mediana 
é 6,36 cm. 


ESTIMATIVAS POR INTERVALO DE CONFIANÇA 
PARA MÉDIAS (GRANDES AMOSTRAS) 


6.5. Determine (a) um intervalo de confiança de 95% e (b) um intervalo de confian- 
ça de 99% para estimar a altura média dos estudantes do Problema 6.3. 


(a) Os limites de confiança na base de 95% são X +1,980/Vn. 

Usando $ = 67,15 роз. e $ = 2,93 pols. como estimativa de 0 (v. Probl. 6.3), 
os limites de confiança são 67,45  1,96(2,93//100 ) ou 67,45 = 0,57 pols. Assim, 
o intervalo de confiança de 95% para a média u da população é 66,88 a 68,02 polega- 
das, que se pode denotar por 66,88 < y < 68,02. 

Podemos, pois, dizer que a probabilidade de a altura média da população estar 
entre 66,88 e 68,02 polegadas é de 95% ou 0,95. Ern símbolos, escrevemos 
Р(66,88 < u < 68,02) = 0,95. 
Isto equivale a dizer que temos 95% de confiança em que a verdadeira média da popu- 
lação esteja entre 66,88” e 68.02”. 


(b) Os limites de confiança na base de 990580 X = 2,580/Vn. Para o nosso caso 
к = 258-- = 6145 + 25825? = 07,45 = 0,76 
3 т 0 
Assim, o intervalo de confiança de 99% para а média da população é 66,69 а 
68,21 polegadas, que se pode denotar por 66,69 < y < 68,21. 
Ao obter os intervalos de confiança acima, admitimos que a população fosse 
infinita, ou tão grande que se pudessem considerar as condições idênticas às de amos- 


tragem com reposição. Para populações finitas sujeitas a amostragem sem reposiçã 


А 
N-1 


a у " 
emlugarde — , Todavia, podemos considerar 
== н 


deveríamos utilizar > 
va N 


o fator Nom 1948 —100 _ q, 967 como essencialmente igual a 1,0 
М = 1516 — 1 : 

de modo que podemos omiti-lo. Se o levarmos em conta, os limites de confiança serão 

67,45 +0,56 e 07,15 + 0,78 polegadas respectivamente. 


6.6. A medida dos diámetros de uma amostra aleatória de 200 mancais fabricados 
por determinada máquina durante uma semana acusa média de 0,824” e desvio 
padrão de 0,042”. Determine intervalos de confiança (а) de 95% e (b) de 99% 
para o diámetro médio de todos os mancais. 
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(a) Os limites de confiança de 95%sáo 
5 ` $ 0,042 
X + 196-2 = @ +196 = 0,824 = 1,96— = 0,824 = 0,0058 pols. 
"сут Ca yo " 


ou 0,824 + 0,006 pols. 


(b) Os limites de confiança de 99% são 


X -258-- = a -258-- = 082% = 
vn vn 


ou 0,824 = 0,008 pols. 


0,824 + 0,0077 pols 


Note-se que tomamos o desvio padrão dado como o desvio padrão modificado 
%. Se o desvio padrão fosse s, deveríamos ter utilizado 
# = Vn/(n —1)s = V200/199 s 
que pode ser tomado como s para todos os fins práticos. Em geral, para m > 30, 
podemos considerar se $ como praticamente iguais. 


6.7. Determine limites de confiança (4) de 98%, (b) de 90% e (e) de 99,73% para о 
diâmetro médio do Problema 6.6. 


(a) Seja z, tal que a área sob a curva normal à direita de 2 — а, seja 1%. Então, por si- 
metria, a área à esquerda do # = —2c é também 1%, de modo que a área sombreada 
é 98% da área total. 
Como a área total sob a curva é 1, a área de 2=0 а е = 2, é 0,49; logo, 
Ze = 2,83. 
Assim, os limites de confiança de 98% são 


= 0,824 + 2,33 0042 


v200 


= 0,824 = 0,0069 pols. 


Fig. 6-1 


(Б) Queremos z,talqueaáreade 2=0 a 2 = 2, seja 0,45; então = 1,645. 


Assim, os limites de confiança de 90%510 


7 += 1,845 — = 0,824 + 1,645 0,048 L 0,824 = 0,0049 pols. 
va 200 


(c) Os limites de confiança de 99,73% são 
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6.8. Ao medir um tempo de reação, um psicólogo estima o desvio padrão em 0,05 
segundos. Qual o tamanho de uma amostra de medidas que ele deve tomar a fim 
de que possa ter (a) 95% e (b) 99% de confiança em que o erro de sua estimati- 
va do tempo médio de reação não supere 0,01 segundos? 


(a) Os limites de confiança de 95% são X =1,960//n, o erro da estimativa sendo 
1,960/Vn. Tomando о = s = 0,05 segundos, vemos que este erro será igual a 
0,01 segundos se (1,96)(0,05)/Vm = 0,01, istoé, Ут = (1,96)(0,05)/0,01 = 9,8 
ou п = 96,04. 

Podemos assim ter 95% de confiança em que o erro da estimativa será inferior a 0,01 se 
n for igual a ou maior do que 97. 


(b) Os limites de confiança de 99%são X +2,580/Vn. Então (2,58)(0,05)/V/n = 0,01, 
ou n = 166,4. Assim, podemos ter 99% de confiança em que o erro na estimativa será 
inferior a 0,01 só se п for igual a, ou maior do quc 167. 


6.9. De um total de 200 notas em matemática, uma amostra aleatória de 50 notas 
acusa média de 75 e desvio padrão de 10. (a) Quais os limites de confiança de 
95% para estimar a média das 200 notas? (b) Com que grau de confiança pode- 
ríamos afirmar que a média das 200 notasé 75 +1? 


(a) Como o tamanho da população não é muito grande comparado com o da amostra, 
devemos fazer um ajuste. Então, os limites de confiança de 95% são 


m 5 с N = 
X+1,960g = # 518674 тш = = ви 
(b) Os limites de confiança podem ser representados por 
р M — uk (10 
Ё = zo = NE ts 1,28 2, 
Como esta expressão deve ser igual а 75 + 1, temos 1,23 2, = 1 ou 2, = 0,81. 


A área sob a curva normal de z = 0 a z = 0,81 é 0,2910; logo, o grau de confiança 
procurado é 2(0,2919) = 0,582, ou seja, 58,2%. 


ESTIMATIVAS POR INTERVALO PARA 
MÉDIAS (PEQUENAS AMOSTRAS) 


6.10. Os coeficientes de confiança de 95% (“duas caudas”) para a distribuição nor- 
mal são dados por +1,96. Quais são os coeficientes correspondentes para 
a distribuição f se x 


(a) v=9, (b) v=20, (c) у = 80, (d) v=60? 
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Para os coeficientes de confiança de 95% (“duas caudas”) a área sombreada total 
na Fig. 6-3 deve ser 0,05. Assim, a área sombreada à direita é 0,025 e o valor crítico 
correspondente é 19,975. Então, os coeficientes de confiança procurados são 1 10,975. 
Para os valores dados de v são: (а) +2,26, (b) +2,09, (с) +2,04, (d) =2,00. 


Fig. 6-3 
6.11. Uma amostra de 10 medidas do diámetro de uma esfera acusa média 
X = 4,38” e desvio padrão s = 0,06". Determine limites de confiança (a) de 
95% e (b) de 99%, para o diámetro efetivo. 


(a) Os limites de confiança de 959osão dados por X = fogzs(S/V t — 1). 
Como ›=п—1 = 10—1 = 9, obtemos to975 = 2,26 (v. também Problema 
6.10(0)). ; 
Fazendo X =4,38 e = 0,06, obtemos os limites de 95% procurados: 


6 


138 = 296—008 — 4,8 = 0,0452 pols. 
T 


Podemos, assim, ter 95% de confiança em que a verdadeira média esteja com- 
preendida entre 4,38 — 0,045 24,335" e 4,38 + 0.045 =4,425”. 


(Ф) Para » = 9, togos = 3,25. Então, os limites de confiança de 99% são 
X Etogos(S//n—1) = 438 =3,25(0,06/V10—1) = 438 + 0,0650 pols. 
e o intervalo de 99% de confiança vai de 4,315” a 4,445”. 


6.12. (a)Faça o Problema 6.11 supondo válidos os métodos da teoria das grandes 
amostras. (b) Compare os resultados dos dois métodos. 


(a) Utilizando a teoria das grandes amostras, os limites de confianga de 95%sio 


А 0.06 
X = 196-9 = 438 + 19 = 4,38 + 0,037 pols. 
vn У10 


onde tomamos o desvio padráo amostral de 0,06 como estimativa de 0. Analoga- 
mente, os limites de confiança de 99% são 


4,88 = (2,58)(0,06)/V10 = 4,38 + 0,049 ро}. 
(b) Em cada caso, os intervalos obtidos pelos métodos das pequenas amostras são mais 


amplos do que os obtidos pela teoria das grandes amostras, o que já cra de esperar, 
uma vez que há menos precisão quando lidamos com pequenas amostras. 
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ESTIMATIVAS POR INTERVALOS DE 
CONFIANÇA PARA PROPORÇÕES 


6.13. 


н 


6.15. 


6.14. 


Ота amostra aleatória de 100 eleitores de certo distrito eleitoral dá 55% 
como favoráveis a determinado candidato. Determine limites de confiança 
para a proporção global de eleitores favoráveis ao candidato (a) na base de 
95%, (b) na base de 99% e (c) na base de 99,73%. 


(a) Os limites de confiança de 95% para a população são 


1960» = P = 1,964 a- P) = ову = 1,964 | 0.550,45) 


0,10 onde tomamos a proporção amostral, 0,55, como estimativa de p. 
(b) Os limites de confiança de 99% para p são 


0,55 = 2,58V(0,55)(0,45)/100 = 0,55 = 0,18. 


(c) Os limites de confiança de 99,73% para p são 
ag 
0,55 = 8V/(0,55)(0,45)/100 = 0,55 = 0,15. 
V. Problema 6.27 para um método mais exato de resolução deste problema, 


No Problema 6.13, qual o tamanho da amostra necessário para termos 95% de 
confianga em que o candidato será eleito? 


O candidato será eleito se p > 0,50 ; para termos 95%de confiança em tul resulta- 


do devemos ter à чето 
Prob. (Фф > 0,50) = 0,95. Como (P — p)/V.p(1 — p/m 


é assintoticamente normal, 


рю E € ые 2) cj d. d^ e 1 du 

Ура. — pn я 

ou Prob(p > P— Вур(1— р)/п) = E f e du 
27 loa 


A comparacáo com Prob(p > 0,50) = 0,95 utilizando o Apéndice C, mostra que 
P—BVpü-pyn = 0,50 onde В = 1,645 
Tomando então P=0,55 e a estimativa p = 0,55 do Problema 6.13, temos 


0,55 — 1645 V/(0,55)(0,45)/n = 0,50 ou n = 271 


Em 40 jogadas de uma moeda, apareceram 24 “caras”. Determine limites de 
confiança: (a) de 95%, (b) de 99,73% para a proporção de “caras” em uma 
sequência ilimitada de jogadas. 
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(a) Ao nível de 95%, Ze = 1.96. Levando os valores P = 24/40 = 0,6 ел = 40 na 
fórmula p = P t z,VP(1 — Py/n, obtemos p = 0,60 + 0,15, o que dá o intervalo 
0,45 а 0,75. 


(b) Ao nível de 99,73% 2. = 3. Utilizando a fórmula p = P + z,V P(1 — P)/n, obte- 
mos p = 0,60 + 0,23, o que dá o intervalo 0,37 a 0,83. 
A fórmula mais exata do Problema 6.27 dá o intervalo de confiança de 95% como 
0,45 a 0,74, c o intervalo de 99,73% de confiança como 0,37 a 0,79. 


INTERVALOS DE CONFIANCA PARA DIFERENCAS E SOMAS 


6.16. Uma amostra de 150 lâmpadas marca А acusa vida média de 1.400 horas, com 
desvio padrão de 120 horas. Uma amostra de 200 lâmpadas marca B acusa vi- 
da média de 1.200 horas e desvio padráo de 80 horas. Determine limites de 
confianga para a diferenga entre as vidas médias das duas marcas (a) na base 
de 95% e (b) na base de 99%, 


Os limites de confiança para a diferença entre as vidas médias das marcas А o B 
sáo dados por 


La Жу + 


(a) Os limites de confiança de 95% são: 
1400 — 1200 + 1,96(120)2/150 + (80)2/100 = 200 + 24,8. 


Podemos assim ter 95% de confiança em que a diferença entre as médias das 
populações esteja entre 175 e 225 horas. 


(b) Os limites de confiança de 99% são: 
1400 — 1200 + 2,58/(120)2/150 + (80)2/100 = 200 = 32,6. 


Podemos, pois, ter 99% de confiança em que a diferença entre as médias das po- 
pulações esteja entre 167 e 233 horas. 


6.17. Em uma mostra aleatória de 400 adultos e 600 rapazes que assistem a deter- 
minado programa de televisão, 100 adultos e 300 rapazes expressaram aprova- 
ção ao programa. Construa limites de confiança (a) de 95% e (b) de 99% para 
a diferença entre as proporções de todos os adultos e todos os rapazes que 
assistem ao programa e o aprovam. 


Os limites de confiança para a diferença entre as proporções dos dois grupos são 
dados por 


2191 a 


onde os índices 1 e 2 se referem, respectivamente, a rapazes e adultos. Aqui, 
Р, — 300/600 = 0,50 е Po = 100/400 = 0,25 
são respectivamente as proporções de rapazes e de adultos que aprovam o programa. 


(a) Limites de confiança de 95% são: 
0,50 — 0,25 + 1,961(0,50)(0,50)/600 + (0,25)(0,75)/400 = 0,25 = 0,06. 


6.18. 
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Podemos, assim, ter 95% de confiança em que a diferença entre as verdadeiras 
proporções esteja entre 0,19 e 0,31. 


(5) Limites de confiança de 99%: 
0,50. 0,25  2,58/(0,50)(0,50)/600 + (0,25)(0,75)/400 = 0,25 = 0,08. 


Podemos, assim, ter 99% de confiança em que a diferença entre as verdadeiras 
proporções esteja entre 0,17 e 0,33, 


A força eletro-motriz média das baterias fabricadas por determinada compa- 
nhia é de 45,1 volts, com desvio padrão de 0,04 volts. Ligadas em série quatro 
dessas baterias, determine limites de confiança (a) de 95%, (b) de 99%, (c) de 
99,73% e (d) de 50% para a força eletro-motriz total. 


Sejam Ey, Ej, Ez e Ey as белт, das quatro baterias; temos 


HE, t Ro PE I Eg T +a 


с 
Ok + E ЖЕ 


Então, como fy, = 


= v4(004) — 0,08 


(a) Os limites de confiança de 95% são: 180,4 + 1,96(0,08) = 180,4 + 0,16 volts. 


Pra 


TE +ES+HE¿4 E, 


(b) Os limites de confiança de 99%são: 180,4 + 2,58(0,08) = 180,4 + 0,21 volts. 
(c) Os limites de confiança de 99,73%sá0: 180,4 + 3(0,08) — 180,4 + 0,24 volts. 
(d) Os limites de confiança de 507%são: 180,4 = 0,6745(0,08) = 180,4 + 0,054 volts. 


O valor 0,054 volts É chamado erro provável. 


INTERVALOS DE CONFIANÇA PARA VARIÂNCIAS 


6.19. 


O desvio padráo das vidas de uma amostra de 200 lámpadas elétricas é de 100 
horas. Determine limites de confiança (а) de 95% e (b) de 99% para o desvio 
padrão de todas as lâmpadas do mesmo tipo. 


Aplica-se aqui a teoria das grandes amostras. Assim (v. Tábua 5-1, pág. 227), os 
limites de confiança para o desvio padrão O da população são dados por S o/V2n, 


onde z, indica o nível de confiança. Utilizamos o desvio padrão da amostra como esti- 
mativa do desvio padrão O da população. 


(a) Os limites de confiança de 957%são: 100 + 1,96(100)/4/400 = 100 = 9,8. 
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Podemos, pois, ter 95% de confiança em que o desvio padrão da população esteja 
compreendido entre 90,2 e 109,8 horas. 


(b) Os limites de confiança de 99% são: 100 + 2,58(100)/у 400 = 100 + 12,9 


Podemos, pois, ter 99% de confiança em que o desvio padrão da população esteja 
compreendido entre 87,1 e 112,9 horas, 


6.20. No Problema 6.19, qual o tamanho da amostra necessária para que possamos 
ter 99,73% de confiança em que o desvio padrão da população não difira do 
desvio padrão da amostra (a) em mais de 5%, (b) em mais de 10%? 


Tal como no Problema 6.19, os limites de confianga de 99,73% para O são 


S=30//2n = з + З Ут, tomando s como estimativa de 0. Então, o erro 
percentual no desvio padrão é 
3s//2n 
s 


(a) Se 300/V Zn = 5, então n — 1.800. A amostra deve ser de 1.800 ou mais lâmpadas. 
(b)Se 300/V/2n. = 10, então n = 450. A amostra deve sex deno mínimo 450 lâmpadas. 


6.21. O desvio padrão das alturas de uma amostra aleatória de 16 estudantes do 
sexo masculino, escolhidos em uma escola de 1.000, é 2,4”. Determine limites 
de confiança (a) de 95% e (b) de 99% para o desvio padrão das alturas de 
todos os estudantes da escola. 


(a) Os limites de confiança de 95% são dados por SY п/хрәлв € S/n [Xopas- 
Para »=16-1=15 graus de liberdade, 
Mons =27,5 ош Xos=5M © Xíps = 626 ou 

Xopas = 2,50. 

Então os limites de confiança de 95%bsáo 

240/16/524 е 2,40/16/2,50, 
isto é, 1,83” е 3,84". 
Podemos, pois, ter 95% de confiança em que o desvio padrão da população esteja 

entre 1,83" о 3,84”. 


(b) Os limites de confiança de 997 são dados por SV AlXo вов € SN n/Xopos- 
Рага »= 16—1 — 15 graus de liberdade, 
sos = 328 ou Xo995=5,13 е Ж ооѕ = 4,60 ou 
Xonos = 2,14. 
Então, os limites de confiança de 997% são 
240V16/573 è  240V16/2,14, 


isto é, 1,68” e 4,49”. 


Podemos, pois, ter 99% de confianga em que o desvio padráo da população esteja 
entre 1,68" e 4,49”. 
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6.22. Faça o Problema 6.19 utilizando a teoria das pequenas amostras (mostragem 
exata). 


(a) Os limites de confiança de 95% são dados por SW n/xo99s e SV/n[Xopas 
Para v = 200 — 1 = 199 graus de liberdade, obtemos, como no Probl. 4.11, pág. 175 


1 
Xem = 5 Goes + MIT IT) = 5(106+1902 = 239 


Kors = 5 бооз + VAIO Т) = (190419929 = 161 
donde Xo97s —15,5 е Xop25 =12,7. 
Então os limites de confiança de 9570são 
100ү200/15,5 = 91,2 е — 100/200/12,7 = 111,8 
horas, respectivamente. Podemos, pois, ter 95% de confiança em que o desvio padrão 
da população esteja entre 91,2 e 111,3 horas. 


Compare-se com o resultado do Problema 6.19(a). 


(Б) Os limites de confiança de 99% são dados рог SY п/о 995 e SY n/Yopos- 
Para v = 200 — 1 = 199 graus de liberdade, 


1 

sos = L Copos VE(IU) 1)? = 108,58 110,92): = 253 
2 2 
1 

Xaos = y (topos + VIII) 1) = ic 2,58 1 19,92)? = 150 


donde Xpgos =15,9 е Xoy00s =12,2. 


Então os limites de confiança de 99%são 100/200/15,9 = 889 е 
100y200/12,2 — 115,9 
horas, respectivamente, Podemos, pois, ter 99% de confiança em que o desvio padrão 
da população esteja entre 88,9 e 115,9 horas. 
Compare-se com o resultado do Problema 6.19(5). 


INTERVALOS DE CONFIANÇA PARA RAZÕES DE VARIÂNCIAS 


6.23. De duas populações normais extraem-se duas amostras aleatórias de tamanhos 
16 e 10, respectivamente. Se suas variâncias são 24 e 18, respectivamente, de- 
termine limites de confiança (a) de 98% e (b) de 90% para a razão das variân- 
cias, 


(a) Temos m = 16, n = 10, s? = 


= 18 de modo que 


[5] 


2 
1 


à o [16 _ 
з = (jen = 252 


10 Р 
(as = 20,0 


m-—1 


> 
v 
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Pelo Problema 4.47(b), pág. 198, temos Fogos = 4,96 para »; = 16 1 = 25 e 
» = 10 — 1 = 9 graus de liberdade. Outrossim, pelo Problema 4.47(d), temos, para 
э} 18 © зу = graus de liberdade, Кору= 1/3,89 de modo que 
1/Еоду = 3,89. 
Utilizando então (17), pág. 278, obtemos, para o intervalo de confiança de 98% 


(i WM 252 LÀ 25,2 
CE <a ЕЗ 
сі 


ou 0,83 < < 490 


E 
à 
(B) Tal como em (a), obtemos, do Apéndice F, Foos= 2,84 Код; = 1/2,59. Assim, о 
intervalo de confiança de 90966 


2 
1 /252 ої 25,2 
Es) = A * е) 


2 
i 


ou 0,4437 < x 3,263 


o 
Note-se que o intervalo de confiança de 90% é muito menor do que o intervalo 
de 98% como era de se esperar. 


6.24. Determine limites de confiança (a) de 98% e (b) de 90% para a razão dos 
desvios padrões do Problema 6.23. 


Tomando as raízes quadradas das desigualdades do Problema 6.23, obtemos, para 
os limites de confiança de 98%e 90% 


(a) 053 < L < 221 


92 


o 


(b) 0,67 < < 1,39 


72 


ESTIMATIVAS DE MÁXIMA VEROSSIMILHANCA 


6.25. Suponham-se n observações Х\,...,‚ Xn, feitas sobre uma população nor- 
malmente distribuída, com média desconhecida e variância conhecida. Deter- 
mine a estimativa de máxima verossimilhança da média. 


1 2 
Como Fm = е Ck 021202 
V2: 


temos 
m L = Қы) = Pro 3G n? 
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Assim 

2 ER £5 2 1 2 
(2) ni = -g (270?) — o É (01 — 4) 
Tomando a derivada parcial em relação a Ш vem 

1 

4 Fo = = же 

(8) La О) 
Fazendo 0L/04 = 0 , tem-se 

(4) Fam = 0 ie Emn =i 


ou 
22, 


т 


6) ps 


Assim, a estimativa de máxima verossimilhança é a média amostral. 


| 6.26. Determine a estimativa de máxima verossimilhanga da variáncia no Problema 
| 6.25, supondo conhecida a média mas desconhecida a variáncia. 


Е Escrevendo / (2, о2) em lugar de f(x, 1), tudo quanto se fez no Problema 
6.25, até a equação (2), ainda se aplica. Então, tomando a derivada parcial em relação a 
02, temos 


Fazendo àL/óe? = ( obtemos 
о = 
V. Problema 6.63. 
PROBLEMAS DIVERSOS 
6.27. (a) Se P ё а proporção observada de sucessos em uma amostra de tamanho п, 


mostre que os limites de confiança para estimativa da proporção p de 
sucessos na população, ao nível de confiança z,, são dados por 


(b) Use a fórmula deduzida em (a) para obter os limites de confiança de 
99,73% do Problema 6.13 (c) Mostre que, para п grande, a fórmula em 
(a) se reduza p = P + zey P(1— P)/n, tal como utilizada no Proble- 
ma 6.13. 
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Se g 


6.28. 


(a) А proporção amostral P em unidades padronizadas é P—p_ Р-р - 


"p Vpl — pn 


Os valores máximo e mínimo da variável padronizada são + z,, onde Zç determi- 
na o nível de confiança. Nesses valores extremos devemos, pois, ter 


P=-p = S 


Elevando ambos os membros ao quadrado por n e simplificando 
Pappo = 000 
Multiplicando ambos os membros por п e simplificando 
(п + 22)р? — (2nP + 22)p + пр? = 0 


= ифа, b = —(2пР + 22) е с = пР?2, esta equação se torna ap?-- bp +c = 0, 
cuja solução em relação a p é dada рог 

_ —b + yb? da 2uP + 22 + VP ED An + (иР) 
= За = (т + г2) 

_ mP + 22 = a PP) + 22 

Е 2(n + 22) 


Dividindo o numerador e o denominador por 27, vem 


20 ,A РОР), me 
mo n Cam 
Bom cem "E = 


(b) Para limites de confiança de 99,73% zę = 3. Então com P = 0,55 e n = 100 na 
fórmula estabelecida em (a), obtemos p = 0,40 e 0,69, de acordo com o Problema 


6.130). 


(©) Se п é grande, então z2/2n, 2%/4n? e 22/п são todos desprezíveis, podendo ser 


essencialmente substituídos por zero, donde o resultado descjado. 


É possível obter um intervalo de confiança de 95% para o desvio padrão da 
população, tal que sua amplitude seja menor do que a encontrada no Proble- 
ma 6.22(2)? 


Os limites de confiança para o desvio padrão da população, tais como encontra- 
dos no Problema 6.22(a), foram obtidos escolhendo-se os valores críticos de tais que 
a área em cada cauda fosse 2,5%. É possível determinar outros intervalos de confiança 
de 95% escolhendo-se valores críticos de Ж para os quais a soma das áreas nas caudas 
seja 5% ou 0,05, mas de tal forma que as áreas nas duas caudas não sejam iguais. 
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A Tábua 6-2 exibe diversos valores críticos e os correspondentes intervalos de 
confiança de 95%. 


Tábua 6-2 
| Valores críticos Interv. de Confiança de 95% Amplitude 
| Xopi = 12,44, хь = 15,82 92,3 a 1137 21,4 
ла = 12,64, 91,7 а 111,9 20,2 
Хорз = 12,76, | 91,0 a 110,8 19,8 
Xo04 = 12,85, xs = 15,73 89,9 a 110,0 


Por esta tábua vêse que um intervalo de 95% de amplitude apenas de 19,8 é 
91,0 a 110,8 
Pode-se obter um intervalo de amplitude ainda menor prosseguindo-se no mesmo 


método, utilizando valores críticos tais como Xo,031 € Xo,981, Xo,032 € Xoj082 » eto. 
Em geral, entretanto, a redução da amplitude do intervalo assim obtida é despre- 
zível, e nem sequer justifica o trabalho que acarreta. 


Problemas Suplementares 


ESTIMATIVAS NÁO—TENDENCIOSAS E EFICIENTES 


6.29. 


6.30 


6.31. 


Tem-se o seguinte conjunto de valores de medidas de pesos, cm libras: 8,3, 10,6, 9,7, 
88, 10,2 e 94. Determine estimativas não-tendenciosas e eficientes (а) da média da 
população e (b) da variância da população. (c) Compare o desvio padrão amostral com 
o desvio padrão estimado da população. 


Uma amostra de 10 válvulas de televisão fabricadas por certa Companhia acusa vida 
média de 1.200 horas e desvio padrão de 100 horas. Estime (а) a média e (b) o desvio 
padrão da população de todas as válvulas fabricadas pela Companhia. 


(a) Faça o Problema 6.30 no caso de amostras de tamanhos 30, 50, е 100. (5) Que 
conclusões se podem tirar sobre a relação entre os desvios padrões amostrais e as esti 
mativas do desvio padrão da população para as diferentes amostras? 


ESTIMATIVAS POR INTERVALOS DE 
CONFIANÇA PARA MÉDIAS (GRANDES AMOSTRAS) 


6.32, 


A média e o desvio padrão das cargas máximas suportadas por 60 cabos (v. Probl. 5.98) 
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- 6.33, 


6.34. 


6.35. 


6.36. 


são 11,09 t e 0,73 t , respectivamente. Determine limites de confiança (2) de 95% e (b) 
de 99% para a média das cargas máximas suportadas por todos os cabos fabricados pela 
Companhia. 


A média e o desvio padrão dos diâmetros de uma amostra de 200 rebites fabricados por 
uma companhia são 0,72642” e 0,00058”, respectivamente (v. Problema 5.100). Deter- 
mine limites de confiança (2) de 99% (b) de 98% (c) de 95%е (d) de 90% para o diáme- 
tro médio de todos os rebites fabricados pela Companhia. 


Determine (a) limites de confiança de 50%е (b) erro provável para о diâmetro médio do 
Problema 6.33 


Se o desvio padrão da vida de válvulas de televisão é estimada cm 100 horas, qual o 
tamanho da amostra que devemos tomar a fim de que possamos ter (a) 95%, (b) 90%, 
(c) 99% e (d) 99,73% de confiança em que o erro da vida média estimada não exceda 
20 horas? 


Qual deve ser o tamanho da amostra no Problema 6.35 se o erro na vida média estima- 
da não deve ser superior a 10 horas? 


ESTIMATIVAS POR INTERVALO DE 
CONFIANÇA PARA MÉDIAS (PEQUENAS AMOSTRAS) 


6.37. 


6.38. 


6.39. 


12 medidas da resistência de fios de algodão acusam média de 7,38 oz. e desvio padrão 
de 1,24 oz. Determine limites de confiança (a) de 95%e (b) de 99% para a resistência 
média efetiva. 


Faça o Problema 6.37 aplicando os métodos das grandes amostras e compare os resul- 
tados. 


Em um experimento obtiveram-se as seguintes medidas dos tempos de reação de um 
indivíduo a determinados estímulos: 0,28, 0,30, 0,27, 0,33, 0,31 segundos. Deter- 
mine limites de confiança (a) de 95% e (b) de 99% para o tempo médio efetivo de 
reação. 


ESTIMATIVAS POR INTERVALO DE CONFIANÇA PARA PROPORÇÕES 


6.40. 


6.42. 


Uma utna contém bolas vermelhas e brancas em proporções desconhecidas. Extrai-so 
uma amostra aleatória de 60 bolas, com reposição, e verifica-se que 70% são vermelhas. 
Determine limites de confiança (a) de 95% (b) de 99% e (c) de 99,73% para a proporção 
efetiva de bolas vermelhas na urna, Apresente os resultados empregando tanto a fórmula 
aproximada como a fórmula mais exata do Problema 6.27. * 


. No Problema 6.40, qual deve ser o tamanho da amostra para que possamos ter (2) 95%, 


(b) 99% e (c) 99,72% de confiança em que a diferença entre a proporção de vermelhas 
na amostra e a proporção de vermelhas na população não difiram em mais de 5% 


Admite-se que os resultados de uma eleição estejam muito próximos em relação a dois 


TEORIA DA ESTIMAÇÃO 295 


candidatos. Explique, por meio de exemplos, indicando todas as hipóteses, como deter- 
тайпада o número mínimo de votantes necessário para que possa ter (а) 80% (b) 95% 
(c) 99% de confiança na decisão em favor de um ou de outro candidato. 


INTERVALOS DE CONFIANÇA PARA DIFERENÇAS E SOMAS 


6.43. 


6.44. 


6.45. 


Considerem-se dois grupos А e B de pacientes, de tamanhos 50 e 100 respectivamente. 
Ao primeiro foi administrado um novo tipo de soporífero, enquanto que ao segundo foi 
administrado o tipo convencional. Para o grupo 4, o número médio de horas de sono foi 
7,82, com desvio padrão de 0,24 horas. Para o grupo B o número médio de horas de 
sono foi 6,75, com desvio padrão de 0,30 horas. Determine limites de confiança (а) de 
95%e (b) de 99% para a diferença entre as médias de horas de sono proporcionadas pelos 
dois tratamentos. 


Uma amostra de 200 pegas fabricadas por determinada máquina acusou 15 defeituosas, 
enquanto que uma amostra de 100 das mesmas pecas, fabricadas por outra máquina, 
acusou 12 defeituosas. Determine limites de confiança (а) de 95%, (b) de 99% e (c) de 
99,73% para a diferença entre as proporções de peças defeituosas produzidas pelas 
duas máquinas. Discuta os resultados obtidos. 


Uma companhia fabrica mancais cujo peso médio é de 0,638 oz., com desvio padrão de 
0,012 oz. Determine limites de confiança (a) de 95% e (b) de 99% para os pesos de 
lotes de 100 mancais cada. 


INTERVALOS DE CONFIANÇA PARA VARIÂNCIAS OU DESVIOS PADRÕES 


6.46. 


6.47. 


6.48. 


6.49. 


6.50. 


6.51. 


O desvio padrão da resistência de 100 cabos testados por uma companhia é 1.000 185. 
Determine limites confiança (а) de 95% (b) de 99% e (c) de 99,73% para o desvio 
padrão de todos os cabos fabricados pela companhia, 


Determine o erro provável do desvio padrão do Problema 6.46. 


Qual o tamanho da amostra necessário para que possamos ter (д) 95%, (b) 99% e 
(c) 99,73% de confiança em que o desvio padrão de uma população não difira do desvio 
padrão de uma amostra da mesma em mais de 276? 


O desvio padrão das vidas de 10 lâmpadas fabricadas por uma companhia é 120 horas, 
Determine limites de confiança (a) de 9575 (b) de 99% para o desvio padrão das vidas 
de todas as lâmpadas fabricadas pela companhia. 


Faça o Problema 6.49 no caso de 25 lâmpadas acusarem o mesmo desvio padrão de 
120 horas. 


Faça o Problema 6.49 utilizando a distribuição x? no caso de uma amostra de 100 
lâmpadas acusar desvio padrão de 120 horas. Compare os resultados com os obtidos 
mediante utilização da distribuição normal. 5 
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INTERVALOS DE CONFIANÇA PARA RAZÕES DE VARIÂNCIAS 


6.52. 


6.53. 


6.54. 


6.55. 


6.56. 


Os desvios padrões dos diámetros de mancais fabricados por duas máquinas são 0,042 cm. 
e 0,035 cm., respectivamente, tomando-se por base amostras de tamanho 10 em cada 
caso. Determine limites de confiança (a) de 98%е (b) de 9076 para a razão das variáncias. 
Determine os intervalos de confiança (a) de 98%e (b) de 90% para a razão dos desvios 
padrões do Problema 6.52. 

Duas amostras de tamanhos 6 e 8, respectivamente, acusam a mesma variância. Determi- 
ne limites de confiança (a) de 98% e (b) de 90% para а razão das variâncias das popula- 
ções das quais foram extraídas as amostras. 

Acha que as duas amostras do Problema 6.54 tenham sido extraídas da mesma popula- 
ção? Justifique sua resposta. 


Faça (a) o Problema 6.52 c (b) о Problema 6.54 no caso de amsotras de tamanho 120. 


ESTIMATIVAS DE MÁXIMA VEROSSIMILHANÇA 


6.57. 


6.58, 


6.59. 


Suponham-se и observações Xi, ..., Xn feitas em uma distribuição de Poisson com 
parâmetro A desconhecido. Determine a estimativa de máxima verossimilhança de À 


Uma população tem função de densidade dada por 

Ha) = ут uie vt, —m <<, 
Supondo feitas m observações, Xp... Хь. sobre esta população, determine a 
estimativa de máxima verossimilhança de v. 


Uma população tem função de densidade dada por 
( (Е +1)" 0 = 
fe = Lo 


Ei 
em caso contrário. 


Com base em n observações Xj,. - -» X, sobre esta população determine а estimativa 
de máxima verossimilhança de k. 


PROBLEMAS DIVERSOS 


6.60. 


6.61. 


6.62. 


6.63. 


Os coeficientes de confiança de 99% (“duas caudas") рага a distribuição normal são 
dados por + 2,58. Quais são os coeficientes correspondentes da distribuição f se 


(а) r=4, (b) и — 12, (0) „= 25, (d) »=30, (e) р = 40? 


Uma companhia tem 500 cabos. Um teste feito sobre 40 cabos escolhidos aleatoriamente 
acusou resistência média de 2.400 lbs e desvio padrão de 150 lbs. (a) Quais sáo os limites 
de confiança de 95% e 99% para a estimativa da resistência média dos restantes 460 
cabos? (b) Com que grau de confiança poderíamos dizer que a resistência média dos 
restantes 460 cabos é de 2400 + 35 lbs? 


No Problema 6.51, qual o intervalo de confiança de 95% de menor amplitude? 


Suponham-se m observações X,, ..., X feitas sobre uma população com média р 
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desconhecida e variância 02 também desconhecida. É possível determinar estimativas 
de máxima verossimilhança de р e 0” em termos de a, ..., %,? Em caso afirmativo, 
tais estimativas são as mesmas dadas pelos Problemas 6.25 e 6.26? Explique. 


À. M 


capítulo 7 


Testes de Hipóteses e Significáncia 


DECISÕES ESTATÍSTICAS 


Frequentemente devemos tomar decisões sobre populações, com base em 
informações sobre amostras das mesmas. Tais decisões chamam-se decisões esta- 
tísticas. Por exemplo, com base em resultados amostrais, podemos querer decidir 
se determinada vacina é eficiente na cura de determinada doença, se um processo 
educacional é melhor do que outro, se uma mocda é viciada ou não, etc. 


HIPÓTESES ESTATÍSTICAS. HIPÓTESES NULAS 


Na tomada de decisões, é útil formular hipóteses ou suposições sobre as 
populações em jogo. Tais hipóteses, que podem ou não ser verdadeiras, chamam-se 
hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de 
probabilidade das populações. 

Em muitos casos, formulamos uma hipótese estatística com o único fim de 
rejeitá-la, ou anulá-la. Por exemplo, se queremos decidir se determinada moeda é 
viciada, formulamos a hipótese de que a moeda é verdadeira, isto é, р = 0,5 (onde 
p é a probabilidade de “caras”). Analogamente, se desejamos decidir se determina- 
do processo é melhor do que outro, formulamos à hipótese de que não há diferença 
entre os dois processos (isto é, quaisquer diferenças observadas são devidas a meras 
flutuações de amostragem da mesma população). Tais hipóteses costumam chamar- 
se hipóteses nulas, e se denotam por И. 


da T 
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Qualquer outra hipótese que difira de uma dada hipótese chama-se hipótese 
alternativa. Por exemplo, se uma hipótese é p = 0,5, hipóteses alternativas são 
p=0,7,p +0,5 oup > 0,5. Uma hipótese alternativa denota-se por H, . 


TESTES DE HIPÓTESES E DE SIGNIFICÂNCIA 


Se, admitindo que determinada hipótese é verdadeira, obtemos resultados 
que diferem substancialmente do resultado esperado, sob a hipótese formulada, na 
base do puro acaso, utilizando-se a teoria da amostragem, dizemos que as diferenças 
observadas são significativas e, então, estaremos inclinados a rejeitar a hipótese (ou, 
pelo menos, não aceitá-la, com base na evidência obtida). Por exemplo, se em 20 
jogadas de uma moeda obtemos 16 caras, estaríamos inclinados a afirmar que a 
moeda é viciada, embora possamos estar errados. 

Os processos que nos permitem decidir aceitar ou rejeitar uma hipótese, ou 
determinar se amostras observadas diferem significativamente dos resultados espera- 
dos, são chamados testes de hipóteses, testes de significância ou regras de decisão. 


ERROS DO TIPO | E DO TIPO Il 


Se rejeitamos uma hipótese quando ela deveria ser aceita, dizemos que foi 
cometido um erro do tipo I. Se, por outro lado, aceitamos uma hipótese quando 
cla deveria ser rejeitada, cometemos um ето do tipo II. Em qualquer dos casos, 
ocorre um erro de julgamento. 

A validade de testes de hipóteses ou de regras de decisão exige que eles 
sejam delineados de modo a minimizar os erros de decisão. Isto não é tão fácil 
como poderia parecer, pois uma tentativa para reduzir o erro de um tipo é, em ge- 
ral, acompanhada por um aumento do erro do outro tipo. Na prática, um tipo de 
erro pode ser mais sério do que outro, de modo que é necessário chegar-se a uma 
fórmula que permita reduzir o erro mais sério. O único meio de reduzir ambos os 
erros é aumentar o tamanho da amostra; e isso nem sempre é possível. 


NIVEL DE SIGNIFICÂNCIA 


Ao testarmos uma hipótese, a probabilidade máxima com que desejamos 
arriscar um erro do tipo I é chamada nível de significância do teste. Essa probabi- 
lidade, usualmente denotada por «,é, em geral, fixada antes da extração das 
amostras, de modo que os resultados obtidos não influenciam a nossa escolha. 
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Na prática, costuma-se adotar um nível de significáncia de 0,05 ou de 0,01, 
embora outros valores possam também ser usados. Se, p. ex., ao delinear um teste, 
se escolhe um nível de significância de 0,05, ou 5%, significa isto que em cerca de 
S chances em 100 rejeitaríamos a hipótese quando ela devesse ser aceita, ou seja, 
podemos ter 95% de confiança em que tenhamos tomado a decisão correta. Em tal 
caso dizemos que a hipótese foi rejeitada ao nível de 5% de significância, o que 
significa que podemos ter errado com uma probabilidade de 5%. 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO NORMAL 


Para ilustrar as idéias apresentadas acima, suponhamos que, sob determinada 
hipótese, a distribuição amostral de uma estatística S acuse distribuição normal 
com média и, e desvio padrão оу. Então a distribuição da variável padronizada 
Z =(S—,)/0, é a distribuição normal padronizada (média O, variância 1) da 
Fig. 7-1. 


Região crítica | | Região crítica 


Tal como indicado na figura, podemos ter 95% de confiança em que o escore 
z de uma estatística amostral S esteja entre — 1,96 e + 1,96 (pois a área sob a curva 
normal entre esses dois valores é 0,95). 

Todavia, se, na escolha de uma única amostra aleatória, verificamos que O 
escore z está fora do intervalo de — 1,96 a 1,96, poderemos concluir que o evento 
ocorreria com probabilidade de apenas 0,05 (área total sombreada na figura) no 
caso de a hipótese formulada ser verdadeira. Diríamos então que o escore z difere 
significativamente do que seria de esperar sob a hipótese formulada e, assim, esta- 
ríamos inclinados a rejeitar a hipótese. 

A área total sombreada, 0,05, é o nível de significância do teste. Representa 
a probabilidade de erro na rejeição de uma hipótese, i.e., a probabilidade de um erro 
tipo I. Dizemos então que a hipótese é rejeitada ao nível de significância de 0,05, 
ou que o escore z da estatística amostral é significativo ao nível de 0,05. 

O conjunto de valores dos escores z exteriores ao intervalo de — 1,96 a 1,96 
constitui o que se chama região crítica, região de rejeição da hipótese ou região de 
significância. O conjunto dos escores z interior ao intervalo de — 1,96 a 1,96 poderia 
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então ser chamado de regido de aceitação da hipótese. ou região de não-significân- 
cia. 

Com base nas observações acima, podemos formular a seguinte regra de deci- 
são ou teste de hipótese ou de significância: 

(а) Кеўейаг a hipótese ao nível de significância de 0,05 se o escore z da esta- 

tística 5 é exterior ao intervalo de —1,96 a 1,96 (i.e., sez < —1,96 ou se 
z> 1,96). Isto equivale a dizer que a estatística amostral observada é 
significativa ao nível de 0,05. 

(b)Em caso contrário, aceitar a hipótese (ou, se se preferir, náo tomar qual- 

quer decisão). 

Note-se que poderiam ter sido usados outros níveis de significância. P. ex., no 
caso do nível de 0,01, substituiríamos 1,96 por 2,58 (v. Tábua 7-1). Pode-se tam- 
bém utilizar a Tábua 6-1, pág. 275, já que a soma do nível de significância e do 
nível de confiança é sempre 100%. 


TESTES UNILATERAIS E BILATERAIS 


No teste acima, evidenciamos interesse nos valores extremos da estatística S, 
ou seja, em seus escores z em ambos os lados da média, isto 6, em ambas as “caudas” 
da distribuição. Por esta razão, tais testes chamam-se testes bilaterais, 

Frequentemente, entrentanto, estamos interessados apenas em valores extre- 
mos de um ou de outro lado da média, isto é, em apenas uma “cauda” da distribui- 
ção, como, p.ex., quando testamos a hipótese de que um processo é melhor do que 
outro (o que é diferente de testar se um processo é melhor ou pior que outro). Tais 
testeschamam-se festes unilaterais. Em tais casos, a região crítica situa-se apenas em 
um lado da distribuição, com área igual ao nível de significância. 

A Tábua 7-1 dá os valores críticos de z tanto para testes unilaterais como pa- 
ra testes bilaterais, a vários níveis de significância. Os valores críticos de z para 
outros níveis de significância podem ser obtidos utilizando-se a tábua de áreas sob a 
curva normal. 


Tábua 7-1 
Níveis de significância q 0,05 0,01 
Valores críticos de z pa- -1,28 —1,645 239 
ra testes unilaterais, ou 1,28 |ou 1,645 ou 2,33 | ou 
Valores críticos de z pa- -1,645 —1,96 —2,58 
ra testes bilaterais. 1,645 |e 1,96 e 2,58 | e 
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TESTES ESPECIAIS DE SIGNIFICÂNCIA 
PARA GRANDES AMOSTRAS 


No caso de grandes amostras, muitas estatísticas têm distribuição normal 
(ou, ao menos, aproximadamente normal) com média ~s e desvio padrão с. Em 
tais casos, podemos utilizar os resultados acima para formular regras de decisão ou 
testes de hipóteses ou de significância. Os casos especiais que seguem são apenas 
umas poucas dentre as estatísticas de interesse prático. Em cada caso, os resultados 
são válidos para populações infinitas ou para amostragem com reposição. Para 
amostragem sem reposição de populações finitas, os resultados devem ser modifi- 
cados. V. páginas 221, 222 e 224. 


1. Médias 


Aqui S = X, a média amostral; и, х = в а média da população; 
Sg — og — olyn, onde o é o desvio padrão da população e n é o tamanho da 
amostra. A variável padronizada é 
Au (1) 
«ут. 

Quando necessário, usa-se o desvio padrão amostral s (ou $) para estimar o. 

Para testar a hipótese nula de que a média da população é и =a aplicamos 
a estatística (1). Então, utilizando um teste bilateral, aceitaríamos (ou, pelo 
menos, não rejeitaríamos) Не ao nível de 0,05 se, para dada amostra de tamanho 
n com média х 


Л 


t-a 


[7 п 


— 1,96 < < 1,96 (2) 
e rejeitaríamos Ho em caso contrário. Para outros níveis de significância, modi- 
ficaríamos (2) convenientemente. 

Para testar a hipótese de que a média da população é superior a a utilizaría- 
mos ainda a hipótese nula Ho de que a média é igual aa. Em seguida, aplicando 
um teste unilateral, aceitaríamos (ou, pelo menos, não rejeitaríamos) Ho ао 
nível de 0,05 se 


$—a 
— V ur todo 3 
ym E ө) 


(у. Tábua 7-1); e aceitaríamos Ho em caso contrário. Para testar a hipótese de 
que a média da população é inferior a a aceitaríamos Н, ao nível de 0,05 se 
2—9 


> — 1,645 (4) 
cl Vn 
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2. Propoições. 


Aqui S=P, proporção de “sucessos” em uma amostra; Kg - up =p, onde 
р € a proporção de sucessos na população, e п é o tamanho da amostra; 
ag =op = V pajn , onde q = 1 — p. A variável padronizada é 


onde @ = 1—р. A variável padronizada é 
z= РЕР 6) 
vpaln 


Se P — X/n, onde X é o número efetivo de sucessos em uma amostra, (5) se 
escreve 


X-— np 
упр 


4 (6) 


Podem-se fazer, em relação a média, observações semelhantes às acima. 
3. Diferenças de Médias 


Sejam X, e X. médias amostrais obtidas de grandes amostras de tama- 
nhos n, e п, extraídas das respectivas populações com médias p, € Ma ё 
desvios padrão о, e оз. Consideremos a hipótese nula, de que não há dife- 
renga entre as médias das populações, isto é и, = п.е (11), pág. 223, fazendo 
Щщ = M; vemos que a distribuição amostral das diferenças das médias é aproxi- 
madamente normal com média e desvio padrão dados por 


onde, se necessário, podemos utilizar os desvios padrões amostrais observados 
зү ез, (ou $, e $,) como estimativas de 0, € 07. 
Utilizando a variável padronizada dada por 
X,-X2-0 X-—X 
== (8) 


RR 


de maneira análoga à indicada na Parte 1 acima, podemos testar a hipótese nula 
contra a hipótese alternativa (ou a significância de uma diferença observada) ao 
nível adequado de significância. 


4. Diferenças de Proporções 


Sejam P, eP, as proporções amostrais obtidas em grandes amostras de 
tamanhos л, en, extraídas das respectivas populações com médias p, € pz. ` 
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Consideremos a hipótese nula, de que não há diferença entre as proporções das 
populações, isto é, Pı = P2, e, assim, que as amostras foram extraídas realmente 
da mesma população. 


De (13), pág. 224, fazendo pi = рә = р vemos que a distribuição amostral 
das diferenças em proporções é aproximadamente normal com média e desvio 
padrão dados por 


a oa (1,1 
Bap, = 0 pj = Joc» +) (9) 


onde p — TaPi + жР» éutilizado como estimativa da proporção p da população. 


Utilizando a variável padronizada 
cs B;i—PRe—8 Pro Es (10) 


[7 G, 
PPa “E 


podemos testar as diferenças observadas a um nível adequado de significância e, 
assim, testar a hipótese nula. 

Podem-se desenvolver testes envolvendo outras estatísticas (v. Tábua 5-1, 
pág. 227). 


TESTES DE SIGNIFICÂNCIA ESPECIAIS 
PARA PEQUENAS AMOSTRAS 


No caso de pequenas amostras (n < 30) podemos formular testes de hipóte- 
ses e de significância utilizando outras distribuições que não a normal, p.ex., a dis- 
tribuição f de Student, a distribuição qui-quadrado, a distribuição Р, etc. Tais 
testes envolvem a teoria exata da amostragem e são, assim, válidos também no caso 
de grandes amostras, quando então se reduzem aos testes acima, Seguem-se alguns 
exemplos. 


1. Médias. 


Para testar a hipótese Ho de que uma população tem média и utilizamos 


X—p —p 
T = MEL = En (11) 


© 


onde X é a média de uma amostra de tamanho л. Isto equivale à utilização da 
X-p 
«ут 


variável padronizada 4 = 


A AAA ИИИИЙ 
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para n grande, exceto quanto ao fato de usarmos 


$= ynl(n-1) S 
em lugar de 0. A diferença é que, enquanto Z tem distribuição normal, 7 tem 
distribuição de Student, t. Quando п cresce, essas duas distribuições tendem a 
coincidir. Os resultados podem também ser usados quando a população não é 
exatamente normal mas é representada por uma curva “em forma de sino”, 
Podem-se elaborar testes para médias análogas aos da pág. 303 utilizando valores 
críticos de ¿ em lugar de valores críticos de z. 


2. Diferenças de Médias 


Suponhamos duas amostras aleatórias de tamanhos 1, en, extraídas de 
populações normais (ou aproximadamente normais) com desvios padrões iguais, 
ie, ec, = e, Suponhamos ainda que essas duas amostras acusam médias e 
desvios padrões dados por X,, X» e Sı S» respectivamente. Para testar а 
hipótese Ho de que as amostras provém da mesma população (isto б, = Hs » 


bem como о; =, ), utilizamos a variável dada por 


X 2 2 
= эъ o =| ia (12) 
1 ni + Nne 


"i Na 


A distribuição de Т é a distribuição de Student com v = nı +n2—2 graus de 
liberdade. Justifica-se o uso de (12) fazendo-se %, = v, = т em (12), pág. 
224, e utilizando então, como estimador de o? , a média ponderada 


(m 1524 (m4 —1)88 _ MS + rut 
(т — 1) + (ns — 1) ^omctn-2 
onde 97 e 58 são os estimadores não-tendenciosos de ví e oj. Isto é o que se 


chama variância conjunta (pooled variance) obtida mediante combinação dos 
dados. 


3. Variáncias 


Para testar a hipótese Ho que uma população normal tem variância 0? , consi- 
deramos a variável aleatória 
ns _ (n—1)S? (13) 
B e 


que (v. pág. 225) tem distribuição qui-quadrado com п — 1 graus de liberdade. 
Então, se uma amostra aleatória de tamanho т acusa variância s? seremos leva- 
dos, com base em um teste bilateral, a aceitar Ho (ou, ao menos, não rejeitá-la) 
ao nível 0,05, se А 
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ns” 
pas = E < Xéps ^ (14) 


e rejeitá-la em caso contrário. Resultado análogo pode ser obtido para o nível 
0,01 ou qualquer outro nivel. 

Para testar a hipótese H, que a variância da população é maior do que o°, 
utilizaríamos ainda a hipótese nula Ну, porém agora com um teste unilateral. 
Então, rejeitaríamos Ho ао nível de 0,05 (e, conseqüentemente, concluiríamos 
que H, é correta) se a particular variância amostral s? fosse tal que 

2 
-a p Šos (2 5) 


vi 


e aceitaríamos Ay (ou, ao menos, não a rejeitaríamos) em caso contrário. 


. Razóes de, Variáncias 


Em alguns probiemas é de interesse determinar se duas amostras de tamanhos 
m e n, respectivamente, cujas variáncias observadas são s? e 82, provêm, ou 
não, da mesma população normal. Em tais casos, utilizamos a estatística (v. 
pág. 228). 


(16) 


ci, өз sendo as variâncias das duas populações normais das quais se extraíram as 
amostras. Suponhamos que Ay denota a hipótese nula, de que não há diferença 
entre as variâncias das populações, isto é, o? = o3, Então, sob tal hipótese, (16) 
se escreve 


i (27) 


Para testar esta hipótese ao nível, p.ex., de 0,10, observamos primeiro que F, em 
(16), tem distribuição F com m —1, n —1 graus de liberdade. Então, utilizando 
um teste bilateral, aceitaremos Ho (ou não a rejeitaremos) ao nível 0,10, se 


Коз & Z, S Foss (18) 


€ a rejeitaremos em caso contrário. 
Podemos delinear processos análogos, empregando testes unilaterais, no caso 
de querermos testar a hipótese de que uma variância é, de fato, superior à outra. 


Mt 


"т 


e 
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RELAÇÃO ENTRE A TEORIA DA 
ESTIMAÇÃO E O TESTE DE HIPÓTESES 


Das observações precedentes, não podemos deixar de notar que existe uma 
relação entre a teoria da estimação envolvendo intervalos de confiança. e a teoria do 
teste da hipóteses. P. ex., vemos que o resultado (2) para aceitação de H ao nível 
de 0,05 é equivalente ao resultado (1), pág. 275, que conduz ao intervalo de con- 
fiança de 95%. 


1960 o. <q 196“ "m 


ya CDP т 

Assim, pelo menos no caso de testes bilaterais, poderíamos efetivamente uti- 
lizar os intervalos de confiança do Capítulo 6 para testar hipóteses. Resultado 
análogo para testes unilaterais exigiriam intervalos de confianga unilaterais. Em- 
bora tais intervalos sejam de rara aplicação prática, é possível definilos (v. Proble- 
ma 7.136 e também Problema 6.14). 


CURVAS CARACTERISTICAS DE OPERAÇÃO. 
PODER DE UM TESTE 


Vimos como é possível limitar o erro do tipo I escolhendo um nível adeguado 
de significância. É possível evitar erros do Tipo II também, simplesmente não os 
cometendo, o que equivale a nunca aceitar hipóteses. Na prática, entretanto, isto 
não resolve. Em tais casos, faz-se uso das curvas características de operação, ou 
curvas CO, que consistem de gráficos que exibem as probabilidades do erro Tipo П 
sob várias hipóteses. Tais gráficos indicam como testes bem elaborados permitirão 
reduzir os erros do Tipo II, isto é, indicam o poder de um teste para evitar decisões 
erradas. São úteis no delineamento de experimentos para indicar, p.ex., o tamanho 
da amostra. 


CARTAS DE CONTROLE DE QUALIDADE 


Na prática, é frequentemente necessário saber se determinado processo 
sofreu modificações que tornem necessárias providências corretivas. Tais problemas 
surgem, p.ex., no controle de qualidade, onde se deve decidir — em geral rapida- 
mente — se as modificações observadas são devidas apenas ao acaso ou a alterações 
efetivas no processo de fabricação, decorrentes da deterioração das máquinas, 
erros de operários, etc. As cartas de controle constituem um método útil e simples 
para tratar tais problemas (v. Problema 7.29). 
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AJUSTAMENTO DE DISTRIBUIÇÕES TEÓRICAS 
A DISTRIBUIÇÕES AMOSTRAIS DE FREQUÊNCIA 


Quando, através de raciocínio probabilístico ou de qualquer outro processo, 
se dispõe de alguma indicação sobre a distribuição de uma população, é possível 
ajustar essa distribuição teórica (também chamada “modelo” ou distribuição 
“esperada”) à distribuição de freqúéncia obtida a partir de uma amostra da popu- 
lação. O método geralmente utilizado consiste no emprego da média e do desvio 
padrão amostrais para estimar a média e o desvio padrão da população. V. Proble- 
mas 7.30, 7.32 e 7.33. 

O problema de testar a validade, ou a aderência, do ajustamento de distribui- 
ções teóricas a distribuições amostrais é essencialmente o mesmo que o de decidir se 
há diferenças significativas entre valores amostrais e valores da população. A seguir 
descrevemos um teste de grande importância para a validade, ou aderência, de 
distribuiçoes teóricas — o teste qui-quadrado. 

Quando procuramos determinar se uma distribuição normal representa um 
bom ajustamento a determinados dados, é conveniente o papel da curva normal, 
ou papel de probabilidade, como se costuma chamar (v. Problema 7.31). 


O TESTE QUI -QUADRADO DE 
ADERÉNCIA DO AJUSTAMENTO 


Para determinar se a proporção P de “sucessos” em uma amostra de tamanho 
п, extraída de uma população binomial, difere significativamente da proporção 
populacional p de sucessos, utilizamos a estatística dada por (5) ou (6), pág. 304. 
Em tal caso, extremamente simples, apenas dois eventos Ai, А» podem ocorrer, e 
esses eventos chamamos de “sucesso” e “falha”, com probabilidades p e q = 1 — р, 
respectivamente. Um particular valor amostral da variável aleatória X = nP costuma 
chamar-se freqüéncia observada para o evento А |, enquanto que np é a freqüéncia 
esperada. 


EXEMPLO 7.1. Em uma amostra de 100 jogadas de uma moeda não-viciada, com n = 100, 
р = 1, freqüéncia esperada de caras (“sucessos”) é np = (10043) = = 50. A freqüéncia 
observada na amostra naturalmente poderá ser diferente. 


Generalizagáo natural: Ocorrência de k eventos Ai, Az, ..., Ax com proba- 
bilidades pı, P2, ..., рк. Em tal caso, temos uma população multinomial (v. pág. 
162). Se extraímos uma amostra de tamanho л dessa população, as frequências 
observadas dos eventos 4i, ..., Ar podem ser descritas por variáveis aleatórias 
Xi, ..-, Хк (cujos valores específicos zi, 22, ..., a seriam as frequências 
amostrais observadas), enquanto que as frequências esperadas seriam dadas por 
Api,...," respectivamente. Os resultados podem ser indicados como na 
Tábua 7-2. 


LR iiadiai aidia aia iiaiai 


v 
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Tábua 7-2 
pesce 
Evento | А, sd А, 
Frequência "n 
observada x “a Е 


Fregiiência d " РСА " 
esperada Pr Pa "Рк 


EXEMPLO 7.2. Se obtemos uma amostra de 120 jogadas de um dado honesto, de modo que 
n=120, então as probabilidades das faces 1, 2,..., 6 são denotadas por Pt» Por - ++, Pg TeS- 
pectivamente, e são todas iguais ag. As fregiiências esperadas correspondentes são пру, MP2, 

Ape, е são todas iguals a (120) (1 )= 20. Naturalmente, as freqiiências de cada face efetiva- 
mente observadas podem ser diferentes. 


Uma generalização possível da estatística (6), que dê a medida das discrepân- 
cias entre as frequências observadas e as esperadas na Tábua 7-2 consiste em elevar 
ao quadrado a estatística (6) e escrevê-la como 

e 2 XQ 2 POE 2 
Z-n Опр) у Mona) ei 


pm = = 
трд пр na 


onde Х, = Х é а variável aleatória associada a “sucesso”, e Xs 
variável aleatória associada a “falha”. Note-se que ng em (2) é a frequência esperada 


de “falhas”. 
A forma do resultado (20) sugere, como medida da discrepância entre as 


freqüéncias observadas e as esperadas no caso geral, a estatística 


(Х: = прі)? , (Хь пр)? (Хк 
№ = A e A o 
np ә 
когу 
a (X;—np " 
= Xen e EE 21 

É np en 

onde a freqüência total (i.e., o tamanho da amostra) é п, de modo que 
X 4X + БХ = (22) 

Uma expressão equivalente a (21) é 

А ш (23) 


Se x! = 0 as frequências observadas e esperadas concordam exatamente, 
enquanto que se x! > O elas não concordam exatamente. Quanto maior for o 
valor de Y? tanto maior será a discrepância entre frequências observadas e esperadas. 

Como vimos no Problema 7.62, a distribuição amostral de Ж? tal como defi- 
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nida em (21) é representada muito aproximadamente pela distribuição qui-quadrado 
(donde a escolha do símbolo em (21)), desde que as frequências esperadas np; 
sejam no mínimo iguais a 5; a aproximação melhora para valores maiores. O nú- 
mero de graus de liberdade para esta distribuição qui-quadrado é dado por 


(a) v = Е — 1 se as freqüéncias esperadas podem ser calculadas sem recorrer 
à estimação dos parámetros populacionais, com base na amostra. Note-se 
que subtraímos 1 de & em virtude da condição (22), que assegura que, 
desde que conheçamos k — 1 frequências esperadas, a frequência restante 
pode ser determinada. 

(b) v =k — 1 — m se as freqüéncias esperadas só podem ser calculadas esti- 
mando-se, a partir da estatística amostral, zz parâmetros da população. 


Na prática, as frequências esperadas se calculam com base em uma hipótese 
Ho. Se, com base em tal hipótese, o valor calculado de X? dado por (21) ou (23) é 
superior a determinado valor crítico (digamos, хәз ou 290, que são os.valores 
críticos aos níveis de significância de 0,05 e 0,01 respectivamente), concluiremos 
que as freqüéncias observadas diferem significativamente das frequências esperadas 
e rejeitaremos Ho ао nível correspondente de significância. Em caso contrário, 
aceitaríamos Ho ou, pelo menos, não a rejeitaríamos. Tal processo se denomina 
teste qui-quadrado de hipóteses ou de significância. 

Note-se que devemos encarar com restrições as circunstâncias em que X ё 
muito próximo de zero, pois é muito raro que as frequências observadas concordem 
muito bem com as frequências esperadas. Para examinar tais situações, podemos 
determinar se o valor calculado de x? é inferior a X295 ou хё,о:, quando então de- 
cidiríamos que a concordância é demasiadamente boa ao nível de significância de 
0,05 ou 0,01, respectivamente. 

Além da aplicação à distribuição multinomial, a distribuição qui-quadrado 
pode scr utilizada para determinar quão bem outras distribuições teóricas, tais como 
a normal, a de Poisson, etc., se ajustam a distribuições empíricas (ou seja, a distri- 
buições obtidas de dados observados). V. Problema 7.44. 


TABELAS DE CONTINGÊNCIA 


A Tábua 7-2, em que as fregiiências observadas ocupam uma única linha, 
chama-se tabela de classificação de um critério. Como o número de colunas é К, 
costuma-se também chamar tabela 1 X k (leia “um рог А”). Generalizando, pode- 
mos obter tabelas de classificação de dois critérios, ou tabelas de classificação A X К, 
onde as fregiléncias observadas ocupam й linhas e k colunas. Tais tabelas costumam 
amar-se tabelas de contingência. 

A cada freqüéncia observada er uma tabela de contingência h X k corres» 
ponde uma frequiéncia esperada, ou teórica, calculada com base em alguma hipó- 
de acordo com as regras da probabilidade. Essas frequências que ocupam as 


312 PROBABILIDADE E ESTATISTICA 


células de uma tabela de contingência, chama-se freqüéncias celulares. A frequência 
total em cada linha ou em cada coluna é chamada fregúéncia marginal. 

Para investigar a concordáncia entre frequências observadas e frequências 
esperadas, calculamos a estatística 

Ps (X; np. 

peg en 

onde o somatório se estende por todas as células, e os símbolos Ж] € np; represen- 

tam, respectivamente, as frequências observadas e as сврегапса na célula de ordem 

j. Esta soma, que é análoga à (21), contém hk termos. A soma de todas as frequên- 

cias observadas denota-se por п e é igual à soma de todas as frequências esperadas 
(compare-se com a equação (22). 

Como anteriormente, a estatística (24) tem distribuição amostral dada muito 
aproximadamente pela distribuição qui-quadrado, desde que as frequências espera- 
das não sejam muito pequenas. O número de graus de liberdade v dessa distribuição 
qui-quadrado é dado, para h > 1, k > 1,por 

(a) += (%—1)(Е— 1) se as fregiiências esperadas podem ser calculadas 
sem necessidade de estimar parâmetros da população a partir da estatís- 
tica amostral. Рага uma prova disso, veja-se о Problema 7.48. 

(0) и = (А 1)(0— 1) —m se as frequências esperadas só podem ser 
calculadas estimando-se m parâmetros da população a partir da estatís- 
tica amostral. 

Os testes de significância para tabelas ^ X k são semelhantes aos das tabelas 
1X k Obtêm-se as frequências esperadas sujeitas а uma dada hipótese Ho. Uma 
hipótese comumente adotada é que as duas classificações sejam independentes uma 
da outra. 

As tabelas de contingência podem ser ampliadas para dimensões maiores. 
Assim, por exemplo, podemos ter tabelas jj x le X 1, onde há três critérios ou clas- 
sificações. 


CORREÇÃO DE YATES PARA CONTINUIDADE 


Quando se aplicam resultados de distribuições contínuas a dados discretos, 
podem ser feitas certas correções de continuidade, como vimos em capítulos 
anteriores. Existe correção análoga para o caso da distribuição qui-quadrado. A 
correção consiste em escrever (21) como 


(Xi np, — 0,5) af (Xy пр — 0,5) 


x (corrigido) = 
np "ps 


+ sê 
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e é em geral conhecida como correção de Yates, Existe também modificação aná- 
loga para (24). 

Em geral, a correção só se faz quando o número de graus de liberdade é v = 1. 
Para grandes amostras, isto dá praticamente os mesmos resultados que o x?, não 
corrigido; podem, entretanto, surgir dificuldades na vizinhança de valores críticos 
(v. Problema 7.41). Para pequenas amostras em que cada freqüéncia esperada está 
entre 5 e 10, o melhor talvez será comparar ambos os valores corrigido e não 
corrigido de x^. Se ambos conduzem à mesma conclusão a respeito de determinada 
hipótese, tal como a rejeição ao nível de 0,05, raramente surgem dificuldades. Se, 
entretanto, os valores obtidos conduzem a diferentes conclusões, pode-se então ou 
aumentar o tamanho da amostra, ou, se isso não for possível ou não for prático, 
empregar métodos exatos de probabilidades envolvendo a distribuição multinomial. 


COEFICIENTE DE CONTINGÊNCIA 


Uma medida do grau de relacionamento, associação ou dependência das 
classificações em uma tabela de contingência é dada por 
xt 
ge xvn (26) 
que se chama coeficiente de contingência. Quanto maior o valor de C maior o grau 
de associação. O número de linhas e colunas na tabela de contingência determina o 
valor máximo de C, que nunca é superior a 1. Para uma tabela k X k, o valor má- 
ximo de C é dado por V(k — 1)/k. V. Problemas 7.52, 7.53 е 7.127. 


Problemas Resolvidos 


TESTES DE MÉDIAS E DE PROPORÇÕES 
POR MEIO DE DISTRIBUICOES NORMAIS 


7.1. Determine a probabilidade de obter entre 40 e 60 caras, inclusive, em 100 
jogadas de uma moeda não-viciada 


De acordo com a distribuição binomial, a probabilidade procurada é 
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м 


A média e o desvio padrão do número de caras em 100 jogadas sáo dados por 
еза 


- = 1ү — 8 m" _ (iM 1) 
һ = np = 100(3) = 50 o = Vnpa = OO) 
Como np e ng são ambos maiores do que 5, pode-se aplicar а aproximação normal da 
distribuição binomial para calcular o somatório. 

Em escala contínua, entre 40 e 60 caras inclusive é o mesmo que entre 39,5 e 
60,5 caras. 39,5 — 50 


39,5 em unidades padronizadas — 5 = —2,10 


60,5 em unidades padronizadas — 60,5 — 50 _ 
= 2,10 


Probabilidade procurada = área sob a curva normal entre z = —2,10е 272,10 
(área entrez=002=2,10)= 2(0,4821) = 0,9642. 


Para testar a hipótese de que uma moeda é não-viciada, adota-se a seguinte 
regra de decisão: (1) aceitar a hipótese se o número de caras em uma única 
amostra de 100 jogadas fica entre 40 e 60 inclusive, (2) rejeitá-la em caso 
contrário. 


(a) Determine a probabilidade de rejeição da hipótese quando ela é, de fato, 
correta. 

(b) Interprete graficamente a regra de decisão e o resultado da parte (a). 

(c) Que conclusões tiraria se a amostra de 100 jogadas acusasse 53 caras? 60? 

(d) Poderíamos estar errados nas conclusões a respeito de (c)? Explique. 


(a) Pelo Problema 7.1, a probabilidade de não obter entre 40 e 60 caras inclusive se а 
moeda é honesta é igual a 1 — 0,9642 = 0,0358. Esta é a probabilidade de rejeitar 
a hipóteses quando ela é, de fato, correta. 

(b) A Fig. 7-2 ilustra a regra de decisão; tem-se ali a distribuição de probabilidade de 
“caras” em 100 jogadas de uma moeda. 


} 


ES | Região de 
Região de N rejeição 
aceitação 
222,0 zz 2,10 
(39,5 caras) (60,5 caras) 
Fig. 7-2 


Se uma única amostra de 100 jogadas dá um escore z entre —2,10 e 2,10, aceita- 
mos a hipótese; em caso contrário, rejeitamo-la. 

О erro cometido ao rejeitar a hipótese quando ela deve ser aceita б o erro tipo I da 
regra de decisão; e a probabilidade de cometes tal erro igual a 0,0358 pela parte (а), 
acha-se representada pela área total sombreada da figura. 


753; 


(с) 


(a) 
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Se a amostra de 100 jogadas dá um número de caras cujo escore z recaia nas 
regiões sombreadas, poderemos dizer que tal escore difere significativamente do que 
seria de esperar-se se a hipótese fosse verdadeira, Por esta razão, a área total som- 
breada (i.e., a probabilidade de um erro tipo I) é chamada nível de significância de 
regra de decisão; é igual a 0,0358 em nosso caso. Fala-se então em rejeitar a hipó- 
tese ao nível de significância de 0,0358, ou 3,58% 

De acordo com a regra de decisão, deveríamos aceitar a hipótese de que a moeda $ 
honesta, em ambos os casos. Poder-se-ia argumentar que, se tivesse aparecido mais 
uma cara apenas, teríamos rejeitado a hipótese. Esta é uma situação da qual náo se 
pode fugir quando se fixa uma linha divisória rígida na formulação de decisões. 
Sim. Poderíamos aceitar a hipótese, quando ela devesse, de fato, ser rejeitada, tal 
como, p.ex., quando a probabilidade de “cara” é realmente de 0,7 ao invés de 0,5. 

O erro cometido ao aceitar uma hipótese que deve ser rejeitada, é o erro tipo П 

da regra de d o. Para discussão ulterior, v. Problemas 7.23 a 7.25. 


Estabeleça uma regra de decisão para testar a hipótese de que uma moeda é 
honesta, se se considera uma amostra de 64 jogadas da moeda e se se adota o 
nível de significância (a) de 0,05 e (b) de 0,01. 


(a) 


а) 
(2) 


Primeiro método. Se o nível de significância é 0,05, cada árca sombreada na Fig. 7-3 
é 0,025, por simetria. Então, a área entre 0 e 2, é 0,5000 — 0,0250 = 0,4750, e 
21 = 1,96. 

Assim, uma possível regra de decisão será: 
(1) Aceitar a hipótese de que a moeda é honesta se Z está entre —1,96 e 1,96. 


(DR a hipótese em caso contrário. Os valores críticos 1,96 e — 1,96 podem 
também ser lidos na Tábua 7-1. 


Рага exprimir esta regra de decisão em termos do número de caras a ser obtido em 
64 jogadas da moeda, note-se que a média e o desvio padrão da distribuição bino- 
mial exata do número de caras são dados por u = пр = 64(0,5) = 32 


e с = упра = 640505) = 4 


sob a hipótese de que a moeda é honesta. Então Z = (X — и)/о = (X — 82)/4, 


Fig. 7-8 


Se Z= 1,96, (X – 32)/4 = 1,96 ou X = 3984.5е7 = —1,96, (X — 32)/4 =-1,96, 
ou X= 24,16. А regra de decisão pode ser então formulada como: 


Aceitar a hipótese de que a moeda é honesta se o número de caras estiver entre 24,16 
e 39,84, isto é, entre 25 e 39 inclusive. 
Rejeitar a hipótese em caso contrário. 
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74. 


ES 


Segundo Método. Com uma probabilidade de 0.95, o número de caras estará entre 
u-1,960 e u +1,960, ic. np — 1,96\/ пра e np + 1,96\/ лра ou entre 


32 — 1,96(4) = 24,16 е 32+1,96(4)= 39,84, 
о que conduz à regra de decisão acima. 


Terceiro Método. —1,96 < Z < 1,96 é equivalentea —1,96 < (X — 32)/4 < 1,96. 
Consegiientemente —1,96(4) < (X — 32) < 1,96(4) ou'32 — 1,96(4)"< X «3T 
+ 1,96(4), ie. 2416 < Х.< 39,84, о que também conduz 


à regra de decisão acima. 


(b) Se o nível de significância é 0,01, cada área sombreada na Fig. 7-3 é 0,005. Então, a 
área entre 0 e z1 é 0,5000 — 0,0050 = 0,4950 e z1 =2,58 (mais exatamente, 2,575). 
Este resultado pode ser obtido também da Tábua 7-1. 

Seguindo o procedimento indicado no segundo método da parte (a), vemos que, 
com probabilidade 0,99, o número de caras estará entre и — 2,580 е 
и + 2,58 а, isto é, 
32 — 2,58(4) = 21,68 c 32 + 2,58(4) = 42,32, 
Então, a regra de decisão pode ser formulada como: 
(1) Aceitar a hipótese se o número de caras está entre 22 e 42 inclusive. 


(2) Rejeitá-la em caso contrário. 


Como se estabeleceria uma regra de decisão para o Problema 7.3 de modo a 
evitar um erro do tipo 11? 


Um erro do tipo П consiste em aceitar uma hipótese quando ela deve ser rejeitada, 
Para evitar tal erro, em lugar de aceitar a hipótese, simplesmente não a rejeitamos, o que 
pode significar que não estamos formulando nenhuma decisão no caso, Assim, p.ex. 
poderíamos formular a regra de decisão como: 
(1) Não rejeitar a hipótese se o número de caras estiver entre 22 e 42 inclusive. 


(2) Rejeitar a hipótese em caso contrário. 
Na prática, entretanto, é frequentemente importante decidir se uma hipótese deve 
ser aceita ou deve ser rejeitada. Uma discussão completa de tais casos exige uma conside- 


ração dos erros do tipo II (v. Problemas 7.23 — 7.25). 


Em um. experimento sobre percepção extra-sensorial (P.E.S.), pede-se a um 
indivíduo em uma sala que diga a cor (vermelha ou azul) de uma carta escolhi- 
da de um baralho de 50 cartas, por outro individuo em outra sala, O indiví- 
duo interrogado desconhece quantas cartas vermelhas e quantas azuis estão no 
baralho. Se o indivíduo identifica 32 cartas corretamente, determine se os 
resultados são significativos ao nível de significância de (2) 0,05, (b), 0,01. 


Se p é a probabilidade de o indivíduo identificar corretamente a cor da carta, 
então temos de decidir entre as duas hipóteses seguintes 

Ну p=0,5, e o indivíduo está simplesmente “palpitando”, ou seja, o resulta- 

do é devido ao acaso; 

Hy p>0,5, ео indivíduo tem realmente poderes de P.E.S. 

Escolhemos um teste unilateral, pois não nos interessa a capacidade de obter 
escores extremamente baixos, e sim a habilidade de obter escores elevados. 

Se a hipótese Ho é verdadeira, a média e o desvio padrão do número de cartas 
identificadas corretamente são dados por 


(b) 


7.6. 
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п = np = 50(0,5) = 25 e 
Упра = v500,5100,5) = v12, = 3,54 


(a) Para um teste unilateral ao nível de 0,05, devemos escolher z; na Fig. 7-4 de modo 
que a área sombreada na região crítica dos escores elevados seja 0,05. Então, a área 
entre 0 e z, é 0,4500 e z, = 1,645, Este resultado pode ser obtido também da 
Tábua 7-1. 


П 
1 
1 mS 
ı Região crítica 


Fig. 7-4 


Assim, nossa regra de decisão, ou teste de significância é: 
(1)Se o escore z observado é maior do que 1,645, os resultados são significativos ao nível 
de 0,05 e o indivíduo tem P.E.S. 
(2) Se o escore z é inferior a 1,645, os resultados são devidos ao acaso, isto é, não são 
significativos ao nível de 0,05. 
Como 32 em unidades padronizadas é é (32 — 25)/3,54 = 1 ,98, que é maior do que 
1,645, vale a decisão (1), isto é, podemos concluir, ao nível de 0,05, que o indivíduo tem 
P.E.S. 
Note-se que, na realidade, deveríamos aplicar uma correção de continuidade, pois, 
32 em base contínua, está entre 31,5 e 32,5. Todavia, como 31,5 corresponde a um 
escore padronizado de 1,84, a conclusão seria a mesma. 


Se o nível de significância é 0,01, a área entre 0 е2; é 0,4900 ел, = 2,33. Como 32 (ou 
31, ,5) em unidades padronizadas é 1,98 (ou 1,84), ambos menores do que 2,33, conclui- 
ríamos que os resultados não são significativos ao nível 0,01. 

Alguns estatísticos costumam dizer que os resultados significativos ao nível de 
0,01 são altamente significativos; os resultados significativos ao nível de 0,05 mas náo de 
0,01 são provavelmente significativos; enquanto que os resultados significativos a níveis 
superiores a 0,05 são ndo-significativos. 

Segundo estos critérios, concluiríamos que os resultados experimentais obtidos 
acima são provavelmente significativos, exigindo, por isso, investigação adicional. 

Como os níveis de significância são, na realidade, guias para a tomada de decisão, 
alguns estatísticos costumam mencionar as probabilidades em jogo. Por exemplo, neste 
problema, como Р(2 21,84) = 0,0322, o estatístico diria que, com base no experi- 
mento, as chances de erro ao concluir que o indivíduo tem P.E.S. são de cerca de 3 
em 100. A probabilidade mencionada — no presente caso 0, 0322 — costuma designar-se 
por nível de significância descritivo ou experimental. 


O fabricante de determinado remédio alega que o mesmo acusou 90% de 
eficiência em aliviar a alergia por um período de 8 horas. Em uma amostra de 
200 indivíduos que sofriam de alergia, o remédio deu resultado positivo em 
160. Determine se a alegação do fabricante é legítima, ou não. 
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Seja p a probabilidade de obter alívio da alergia com o omprego do remédio. 
Devemos decidir entre as duas hipóteses: 
Hy р = 0,9, e a alegação é correta 
Hg р < 0,9, ca alegação é falsa 
Escolhemos um teste unilateral, pois o que queremos é determinar se a proporção 
de indivíduos beneficiados é muito baixa. 


Região 
Crítica 


Fig. 7-5 


Tomando-se o nível de significância de 0,01, isto é, se a área sombreada na 
Fig. 7-5 é 0,01, então & = —2,33 como se pode ver do Problema 7.5 (b) utilizando-se a 
simetria da curva, ou, pela Tábua 7-1. 
Formulamos então nossa regra de decisão: 
(1) А alegação do fabricante não é legítima se Z é inferior a —2,33 (caso em que rejeita- 
mos Ho). 
(2) Em caso contrário, a alegação do fabricante é legítima e os resultados observados são 
devidos ao acaso (aceitamos então Ho). 
Se Ho é verdadeira, y = пр = 200(0,9) = 180 ? 
в = Упра = У(0200)(0,9)00,1) = 4,28. 
Ora, 160 em unidades padronizadas é (160 — 18 0)/4,23 = —4,73, que é muito menor 
do que —2,33. Assim, pela nossa regra de decisão, concluímos que a alegação do fabri- 


cante não é legítiraa e que os resultados amostrais são aliamente significativos (v. final do 
Problema 7.5). 


77. A vida média de uma amostra de 100 lâmpadas fluorescentes fabricadas por 
determinada companhia é de 1.750 horas, com desvio padrão de 120 horas. 
Se ш $ a vida média de todas as lâmpadas fabricadas pela companhia, teste a 
hipótese и = 1.600 horas contra a hipótese alternativa ш 1.600 horas, 
utilizando um nível de significância de (2) 0,05 e (b) 0,01. 


Devemos decidir entre as duas hipóteses 
Hy а = 1600 horas Ну р = 1600 horas 


Devemos utilizar aqui um teste bilateral, pois HÆ 1.600 inclui valores não só 
maiores como também menores do que 1.600. 
(a) Para um teste bilateral ao nível de 0,05, temos a seguinte regra de decisão: 
(1) Rejeitar Hg se o escore z da média amostral está fora do intervalo — 1,96 a 1,96. 
(2) Aceitar Hg (ou não tomar decisão) em caso contrário. 
A estatística em jogo é a média amostral X. A distribuição amostral de X tem 
média ux = п е o desvio padrão ox = о/ун, onde pe O são a média e o 
desvio padrão da população de todas as lâmpadas fabricadas pela companhia. , 
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Sob a hipótese Ho temos u= 1.600e ox = a/y = 120//100 = 12, utilizan- 
do o desvio padrão amostral como estimativa de 0. Como Z = [73 = 1600/12 = 


== (1570 — 1600)/12 — — 2,50 está fora do intervalo de — 1,96 a 1,96, rejeitamos 
Ho ao nível de significância de 0,05. 


(b) Se o nível de significância é 0,01, o intervalo —1,96 a 1,96 da parte (a) deve ser 
substituído por -2,58 a 2,58. Então, como o escore z= —2,50 está compreendido 
nesse intervalo, aceitamos Ho (ou nào formulamos qualquer decisão) ao nível de 
0,01. 


7.8. No Problema 7.7, teste a hipótese и = 1.600 horas contra a hipótese alterna- 
tiva и < 1.600 horas, utilizando um nível de significância (a) de 0,05, 
(b) de 0,01. 


Devemos decidir entre as duas hipóteses 
Не: р = 1600 horas Ну: os < 1600 horas 


Deve-se usar aqui um teste unilateral (v. Fig. 7-5). 

(a) Se о nível de significância 6 0,05, a região sombreada da Fig. 7-5 tem área de 0,05, e 
obtemos 21 = —1,645, Adotamos, pois, a regra de decisão: 
(1) Rejeitar H se Z é inferior a — 1,645. 
(2) Aceitar Ho (ou não tomar decisão) em caso contrário. 

Como, a exemplo do Problema 7.7(4), o escore z é — 2,50, que é inferior a 
— 1,645, rejeitamos Ho ao nível de 0,05. Note-se que esta decisão é a mesma a 
que chegamos no problema 7.7 (2) utilizando um teste bilateral, 

(b) Seonível de significánciaé; 0,01, o valor de тү na Fig. 7-5, é — 2,33. Então, ado- 
tamos a regra de decisão: 
(1) Rejeitar H, se Z é inferior a —2,33. 
(2) Aceitar H (ou não tomar decisão) em caso contrário. 

Como a exemplo do Problema 7.7(a), o escore z 6 —2,50, que é inferior a —2,33, 
sejeitamos Hj ao nível de 0,01. Note-se que esta decisão é a mesma a que chegamos 
no Problema 7.7(b) utilizando um teste bilateral, 

Vê-se que as decisões relativas a determinada hipótese, baseadas em testes uni- 
laterais ou bilaterais, nem sempre concordam. Isto, aliás, já cra de esperar-se, pois, 
na verdade, estamos testando Ну contra duas hipóteses alternativas diferentes. 


7.9. A resistência dos cabos fabricados por determinada Companhia acusam média 
de 1.800 lbs. e desvio padrão de 100 lbs. Adotando-se uma nova técnica de fa- 
bricação, espera-se aumentar essa resistência. Para testar tal hipótese, toma-se 
uma amostra de 50 cabos fabricados pelo novo processo, obtendo-se uma 
resistência média de 1.850 lbs. Pode-se aceitar a hipótese ao nível de signifi- 
cância de 0,017 


Temos de decidir entre as duas hipóteses 
Ho: и = 1800 Ib, e não há alteração na resistência dos cabos 
Ну 1 > 1800 Ib, e há alteração na resistência dos cabos. 


320 PROBABILIDADE E ESTATÍSTICA 


Deve-se utilizar aqui um teste unilateral (v. Fig. 7-4). Ao nível de 0,01, a regra de 
decisão é: 
(1) Se o escore z observado é superior a 2,33, os resultados são significativos ao nível 
0,01 e Ho é rejeitada. 
(2) Em caso contrário, aceita-se Hg (ou não se formula nenhuma decisão). 
Na hipótese de Hy ser verdadeira, obtemos 


Xu _ 1850 — 1800 
сут 100//50 


que é maior do que 2,33. Concluímos, entáo, que os resultados são altamente significa- 
tivos e que a alegação tem fundamento (isto é, há aumento da resistência dos cabos). 


E = = 8,55 


TESTES QUE ENVOLVEM DIFERENÇAS 
DE MÉDIAS E DE PROPORÇÕES 


7.10. Aplicou-se uma prova a duas turmas de 40 e 50 alunos respectivamente. Na 
primeira turma, a nota média foi 74, com desvio padrão de 8, enquanto que, 
na segunda turma, a média foi 78 e o desvio padrão 7. Há diferença significa- 
tiva entre os resultados das duas turmas, ao nível de significância (а) de 0,05, 
(b) de 0,01? 


Suponhamos as duas turmas provindas de duas populações com médias Шу e 
Hz, respectivamente, Temos então que decidir entre as hipóteses 
Hy ну = ид, ea diferença é devida ao acaso 
Hy ii É lla, е а diferença entre as duas turmas é significativa. 
Pela hipótese Hg as duas turmas provêm da mesma população. А média e o 
desvio padrão da diferença entre médias são dados por 


2 2 
ej о _ SE ПЕ qu 
al ш do t gg = 1006 


onde utilizamos o desvio padrão amostral como estimativa de 0, е 02. 


lap A “E, 


Então 


2 EST „ 24 
= Sto Uoc? 


(a) Para um teste bilateral, os resultados são significativos ao nível de 0,05 se Z é ex- 
terior ao intervalo —1,96 a 1,96. Concluímos então que, ao nível de 0,05, há uma 
diferença significativa entre os resultados das duas turmas, e que a segunda provavel- 
mente é melhor. 

(b) Para um teste bilateral, os resultados são significativos ao nível de 0,01 se Z é exte- 
rior ao intervalo —2,58 a 2,58. Concluímos então que, ao nível de 0,01, não há dife- 
renga significativa entre os resultados das duas turmas. 

Como os resultados são significativos ao nível de 0,05, mas não ao nível de 0,01, 
os resultados são considerados como provavelmente significativos (de acordo com a 
terminologia usada no fim do Problema 7.5). 


7.11. 


742. 
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A altura média de 50 estudantes do sexo masculino que tiveram participação 
acima da média em competições esportivas de uma universidade, é de 68,2 
polegadas, com desvio padrão de 2,5 polegadas, enquanto que um grupo de 
50 estudantes que não demonstraram interesse em tais competições acusa 
altura média de 67,5” com desvio padrão de 2,8”, Teste a hipótese de que os 
estudantes que participam ativamente das competições esportivas são mais 
altos do que os que não se interessam por elas. 


Devemos decidir entre as duas hipóteses 
Ho: шу = #2 е não há diferença significativa entre as alturas médias 
Ну jų > s» e a altura média do 1º grupo é superior à altura média do 2º grupo. 


23-3 


onde utilizamos о desvio padrão amostral como estimativa de 8, è 05. 


Pela hipótese Hg, 


5 


=0 


Ux X, 


Entáo _ 682—075 _ 4a 
= os c VE 


Com base em um teste unilateral ao nível de 0,05, rejeitaríamos a hipótese Hg 
se o escore z fosse superior a 1,645. Assim, ndo podemos rejeitar a hipótese ao nível de 


0,05. 
Note-se, entretanto, que a hipótese pode ser rejeitada ao nível de 0,10 se quiser- 
mos correr o risco de errar com uma probabilidade de 0,10, isto é, uma chance em 10. 


De quanto deveríamos aumentar о tamanho da amostra de cada um dos gru- 
pos do Problema 7.11 para que a diferença observada, de 0,7”, entre as 
alturas médias, seja significativa, ao nível (a) de 0,05(b) de 0,01? 


Seja n o tamanho da amostra de cada grupo e suponhamos Кы) os rd padróes 
permaneçam os mesmos. Então, pela hipótese Но temos | tz 


zm od (2,5)? + (2, E m 09 e 75 
?$g,-3, 


Para uma "m de ag "observada entre as alturas médias, 
= = QUA олу 
a чу 85 
RX 3,75/Yn » 
(a) A diferença observada será significativa ao nível de 0,05 se 


OVA > 1645 ou Vi 288 ш n>% 
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Assim, pois, devemos aumentar O tamanho da amostra de cada grupo em pelo 


menos 78 — 50 = 28. 
(b) A diferenga observada será significativa ao nível de 0,01 se 


олүп 253 ou vi>125 ош n md 


3,75 
Logo, devemos aumentar o tamanho da amostra em cada grupo em pelo menos 
157 -50=107. 


Dois grupos A e B consistem, cada um, de 100 indivíduos portadores de de- 
terminada enfermidade. Aplica-se um soro ao grupo А, mas não ao grupo В 
(aqui chamado grupo de controle); afora isso, os dois grupos sáo tratados de 
maneira idéntica. Constata-se que, nos grupos 4 e B, 73% e 65%, respectiva- 
mente, se curam da enfermidade, Teste a hipótese de que o soro é eficiente, 
ao nível de 0,01, (b) de 0,05, (c) de 0,10. 


Sejam p, е py respectivamente as proporções das populações curadas (1) aplican- 
dose о soro, (2) sem o soro. Devemos decidir entre as duas hipóteses 
Ho: рі =P» e as diferenças observadas são devidas ao acaso, isto é, o soro não é 
eficiente 
Hy pı > Pa eo soro é eficiente. 
Pela hipótese Ho, 


- ¡NS 
билу 7 5 ру-ру De ur 
= a ozows0( +23 = 0,0648 
j E 100 ' 100 Р 


onde utilizamos como estimativa de р а proporgáo média de curas nos dois grupos 
amostrais, dada por (75 +65)/200 =0,70, e onde q =1 — р = 0.30. Então 


Ру Р, 50 — 0,65 
17 Рз 0Л50—0650 _ ig, 


(a) Com base em teste unilateral. ao nível de 0,01, rejeitaríamos a hipótese Ho somente 
se o escore z fosse superior a 2,33. Como z é de apenas 1,54, devemos concluir que 
os resultados são devidos ao acaso, neste nível de significância. 

(b) Com base em teste unilateral. ao nível de 0,05, rejeitaríamos a hipótese H somente 
se o escore z fosse superior а 1,645. Então, ainda aqui, devemos concluir que os 
resultados são devidos ao acaso. 

(c) No caso de um teste unilateral ao nível de 0,10, rejeitarfamos H somente se о 
езсоте л fosse superior а 1,28. Como esta condição é satisfeita, devemos concluir 
que o tratamento é eficiente (ао nível de significância de 0,10). 

No e nossas conclusões neste problema dependem de quanto queiramos 
arriscar a errar. Se os resultados são meramente casuais e se concluímos que eles são devi- 
dos à aplicação do sore (erro tipo 1), poderíamos ser levados a aplicar o soro a grandes 
grupos de pacientes, apenas para constatar que 0 tratamento não é eficiente. E este é um 
risco que nem sempre poderemos desejar assumir. 
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Por outro lado, poderíamos concluir que o soro não é eficiente, quando ele, na 
realidade, o é (erro tipo IT), Tal conclusão é muito perigosa, especialmente quando está 
em jogo a vida humana. 


7.14. Faça o Problema 7.13 se cada grupo consiste em 300 pacientes e se o soro se 
revela eficiente em 225 pacientes do grupo А e 195 do grupo B. 


Neste caso, as proporções de pacientes curados nos dois grupos são, respectiva- 


mente, de 225/300 = 0,750 e 195/300 =0,650, isto é, as mesmas que no Probl. 7.13 
Pela hipótese Ho. 


- = LANS lg d 
tp, om 7 0 “pp ^ yo t zi) Е олоо + aic) 


= 0,0374 


onde (225 + 1951/600 — 0,70 é utilizado сото estimativa de p. Então 


q. РТР _ 07500650 oa 

op -P 0,0374 TOW 

Como este valor z é superior a 2,33, podemos rejeitar a hipótese ao nível de 0,01, 

isto é, podemos concluir que O soro é eficiente, com probabilidade de erro de apenas 


0,01. 


Isto mostra como um aumento no tamanho da amostra pore aumentar а confiabi- 
lidade de decisões. Em muitos casos, todavia, pode não ser prático aumentar o tamanho 
da amostra. Seremos, então, forçados a tomar decisões com base na informação de que 
dispomos e, assim, arcar com maior tisco de tomar decisões incorretas. 


7.15. Uma consulta a 300 eleitores do distrito A e 200 eleitores do distrito B acu- 
sou 56% e 48%, respectivamente, a favor de determinado candidato. Ao nível 
de significáncia de 0,05, teste a hipótese de que (4) não há diferença entre os 
dois distritos, (b) o candidato tem preferência no distrito 4. 


Sejam p, c pa as proporções de todos os eleitores dos distritos А е В respectiva- 


mente, que são favoráveis ao candidato. 
Pela hipótese (Hg: рр = Pa) temos 


E EN ш 5 NEN, 
арра = 0 аеру 7 "EE i) Е mm 200 / 


= 0,0456 


onde utilizamos como estimativas de p e q os valores 
[(0,56)(300) + (0,48)(200)]/500 = 0,528 e 1— 0,528 = 0,472. 


Então 
z = Part _ 05600480 _ ¡ny 
Tp Pa 0,0456 ib 
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(a) Se queremos apenas determinar se há diferença entre os dois distritos. devemos 
decidir entre as hipóteses(Ho: р; = рь) e (Er: py % рз), (teste bilateral). 

Com base em teste bilateral ao nível de 0,05 rejeitaríamos /7 se Z estivesse fora 
do intervalo —1,96 a 1,96, Como Z= 1,75 é interior ao intervalo, náo podemos 
rejeitar Ho a este nível, isto é, não há diferença significativa entre os dois distritos, 

(b) Se queremos determinar se o candidato é preferido no distrito 4, devemos decidir 
entre as hipóteses (Ho: py = po) e (Ну: pi > po) (teste unilateral), 

Com base em teste unilateral, ao nível de 0,05, rejeitaríamos H se Z fosse supe- 
rior a 1,645. Como este é, efetivamente, o caso, podemos rejeitar Но a este nível e 
concluir que o candidato é preferido no distrito A. 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO + DE STUDENT 


7.16. No passado, determinada máquina produziu arruelas de espessura média de 


dels 


0,05 pols, A fim de verificar se a máquina ainda está em boas condições, to- 
ma-se uma amostra de 10 arruelas, cuja espessura média é de 0,053 pols., com 
desvio padrão de 0,003 pols. Teste a hipótese de que a máquina ainda está em 
boas condições, utilizando um nível de significância (a) de 0,05, (b) de 0,01. 


Temos de decidir entre as hipóteses 
Ho: H = 0,050, e a máquina está em boas condições 
Ну: 40,050, e a máquina não está mais em boas condições; 
exige-se, portanto, um teste bilateral. 
Pela hipótese Hg temos 
т 


0,053 — 0,050 
LO -Vy/10-1 = 3,00. 
— 0,003 


(a) Рата um teste bilateral, ao nível de 0,05, adotamos a regra de decisão: 
(1) Aceitar Ho se T está no intervalo (олз а fas que, para 10 -17 9 
graus de liberdade, corresponde ao intervalo —2,26 c 2,26. 
(2) Rejeitar Ho em caso contrário. 
Como Т = 3,00, rejeitamos Ho ao nível 0,05. 
(b) Para um teste bilateral, ao nível de 0,01, adotamos a regra de decisão: 
(1) Aceitar Hg se T está no intervalo təs а tsss» que, para 10 —1 = 9 graus 
de liberdade, corresponde ao intervalo —3,25 a 3,25. 
(2) Rejeitar Ho em caso contrário. 

Como Т = 3,00, aceitamos Но ao nível 0,01. 

Como podemos rejeitar Hg ao nível de 0,05 mas não ao nível de 0,01, diremos 
que o resultado é provavelmente significativo (v. terminologia ao fim do Problema 
7.5). Seria, assim, aconselhável proceder a uma verificação na máquina ou, pelo me- 
nos, tomar outra amostra), 


Um teste da resistência de 6 cordas fabricadas por determinada companhia 
acusou resistência média de 7.750 Ibs. com desvio padrão de 143 lbs, contra a 
alegação do fabricante de que a resistência média seria de 8.000 Ibs. Pode-se 
justificar a alegação do fabricante ao nível de (a) 0,05, (b) 0,01? 
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Devemos decidir entre as hipóteses 
Ho: р = 8000 lb, e a alegação do fabricante é justificada 
Hy: в < 8000 lb, e a alegação do fabricante não é justificada. 
Exige-se, pois, um teste unilateral. 
Sob a hipótese Ho, temos —— 
he Ee mi RD р = ge 
145 3 
(a) Para um teste unilateral ao nível de 0,05, adotamos a regra de decisão: 
(1) Aceitar Ho se T é superior a —fo95, oque, para 6 —1 = 5 graus de liberdade, 
corresponde a T > —2,01. 
(2) Rejeitar Ho em caso contrário. 
Como Т = —3,86, rejeitamos Ho. 
(b) Рага um teste unilateral ao nível de 0,01, adotamos a regra de decisão: 
(1) Aceitar Ho se T é superior a — 1099, о que, рага 5 graus de liberdade, cor- 
responde a T > —3,36. 
(2) Rejeitar Hy em caso contrário. 
Como Т = —3,86, rejeitamos Hg. 
Podemos, pois concluir, que é extremamente improvável que a alegação do fabri- 
cante seja justificável. 


7.18. Os 01. (quociente de inteligência) de 16 estudantes de determinado bairro de 
uma cidade acusaram média 107 e desvio padrão 10, enquanto que os Q.I. de 
14 estudantes de outro bairro da cidade acusaram média 112 e desvio padrão 
8. Há diferença significativa entre os Q.I's dos dois grupos ao nível de 
(a) 0,01, (b) 0,05? 


Seg, e Шу denotam os Q.I.'s médios das duas populações de estudantes, devemos 
decidir entre as hipóteses 
Ho: щ = sys e não há diferença essencial entre os grupos 
H,: ty = но» e há diferença significativa entre os dois grupos, 
Pela hipótese Hg, 


кы. 2 пат 
p “К oco md 
cV 1/n, + 1/n3 M n, + 1,—2 


Entáo 


S00 + LAR 112 — 107 
T 10)? 14(* ga E Т = ———®——— = 145 
V 16+14—2 9,44у1/16 + 1/14 


(а) Com base em um teste bilateral ao nível de 0,01, rejeitaríamos Hg se T fosse exte- 
rior ao intervalo —togos a  /o995 que, para n, LH nj— 2 = 16 -- 14 — 2 = 28 
graus de liberdade, corresponde ao intervalo —2,76 a 2,76. 

Não podemos, pois, rejeitar Не, ao nível de significância de 0,01. 

(b) Com base em um teste bilateral ao nível de 0,05, rejeitaríamos Ho se T fosse exte- 
rior ao intervalo — {0,975 a — 0975, que, para 28 graus de liberdade, corresponde 
ao intervalo —2,05 a 2,05. 
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Assim, pois, não podemos rejeitar Ну ao nível de significância de 0,05. 
Concluímos, pois, que não há diferença significativa entre os Q.I.'s dos dois 
grupos. 


7,19, Em um centro agrícola, deseja-se testar o efeito de determinado fertilizan- 
te sobre a produção de trigo. Para isto, escolhem-se 24 lotes de terra de 
mesma área; metade desses lotes é tratada com o fertilizante, metade sem o 
fertilizante (grupo de controle). Quanto ao mais, as condições são idênticas 
para os dois grupos de lotes. A safra média do gmpo de lotes não tratados 
pelo fertilizante foi de 4,8 bushels, com desvio padrão de 0,4 bushels, en- 
quanto que a safra média do grupo de lotes tratados pelo fertilizante foi de 
5,1 bushels, com desvio padrão de 0,36 bushels. Podemos concluir que haja 
melhoria significativa na produção de trigo devida ao emprego do fertilizante, 
adotando-se o nível de significância (2) 1%, (b) 5%? 


Se М, ен, denotam as safras médias das populações tratadas е não-tratadas pelo 
ferilizante, temos de decidir entre as duas hipóteses 
Ho: шу = пэ, е а diferença é devida ao acaso 
Ну u > Hz e a diferença é devida ao emprego do fertilizante 
Pela hipótese Ho, 


51 — 48 
0,397/ 1/12 + 1/12 


(a) Com base ет um teste unilateral ao nível de 0,01, rejeitaríamos Мо se T fosse 


maior do que fog O que, param, +n -2=12+12-2= 
6 2.51. 

Assim. não podemos rejeitar Н ao nivel de significância de 0,01. 

(b) Com base em um teste unilateral ao nível de 0,05, rejeitaríamos Hg se T fosse 
maior do que Zo 9s, O que, para 22 graus de liberdade, 63,72. 

Assim, podemos rejeitar Ho ao nível de significância de 0,05. 

Concluímos, então, que a melhoria da produção de trigo devida ao emprego de 
fertilizante é provavelmente significativa. Entretanto, antes de so adotar uma con- 
clusão definitiva quanto: à eficácia do fertilizante, pode ser conveniente procurar 
maior evidência. 


2 graus de liberdade, 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO QUI-QUADRADO 


7.20. No passado, o desvio padrão dos pesos de pacotes de 40,0 onças enchidos por 
determinada máquina foi de 0,25 onças. Extrai-se uma amostra de 20 pacotes, 
que acusam desvio padrão de 0,32 onças. O aumento aparente de variabili- 
dade é significativo ao nível de (a) 0,05, (b) 0,01? 


TESTES DE HIPÓTESES E SIGNIFICÂNCIA 327 


Temos de decidir entre as hipóteses 
Ho: о = 0,25 onças, e o resultado observado é casual 
Hy: о > 0,25 onças, e a variabilidade aumentou. 
O valor de X? para a amostra é x? = ns?/o? = 20(0,32)2/(0,25)2 = 32,8. 


(а) Em um teste unilateral, rejeitaríamos Но ao nível de 0,05 se o valor amostral de 
fosse maior do que Xps que é igual a 30,1 para v=20 —1 = 19 graus de liber- 
dade. Assim, pois, rejeitaríamos Hg ao nível de significância de 0,05. 
(b) Em um teste "unilateral, rejeitaríamos H ao nível de 0,01 se o valor amostral de 
fosse maior do que Mio». que é igual a 36,2 para 19 graus de liberdade. Então, 
não rejeitaríamos Ho ao nível de significância de 0,01. 
Conclusão: A variabilidade provavelmente aumentou. Impõe-se uma verificação 
da máquina. 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO F 


7.21. Um instrutor tem duas turmas, A e B, para determinada disciplina. A turma 
A tem 16 estudantes, e a turma B 25 estudantes. Em um mesmo exame, 
embora não tivesse havido diferença significativa entre as notas médias, a tur- 
ma А acusou desvio padrão de 9, enquanto que, para a turma В, o desvio 
padrão foi de 12. Podemos concluir que a variabilidade da turma B seja maior 
do que a variabilidade da turma À, ao nível de (a) 0,01, (b) 0,05? 


(a) Utilizando os índices 1 e 2 para as turmas А e P respectivamente, temos s, =9, 
sy =12 de forma que 


6 . m 25 
(9)? = 864, 8 = 82 = — (2) = 150 
5 53-1 24 


E mo o 1 
g=— 
n-1 1. 


Devemos decidir entre as hipóteses 
Hg: сү = су, e qualquer variabilidade observada é devida ao acaso 
Hy: оу > оз, ea variabilidade da turma А é superior à da turma B, 
A decisão deve, pois, bascar-se em um teste unilateral da distribuição Р, Os núme- 
ros de graus de liberdade para as turmas são, respectivamente, 
n=168-1=15, в = 885—1 = 24. 


Ao nível de 0,01, para », = 15, » = 24 temos (Apêndice F), Fog —2,89 
Ora, para as amostras em questáo 


$t 150 — 
ғ = сї = ы = 04 
2 


Então, como F<Fog9 não podemos rejeitar Но ao nível de 0,01. 


a TP TIRE TT NN 
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722. 


(b) Como Fogs =2.11 para 15, 24 graus de liberdade (v. Apêndice F), vemos que 
F<Foss: Assim, também não podemos rejeitar Ho ao nível de 0,05. 


No Problema 7.21, suas conclusões seriam modificadas se se tivesse observado 
diferença significativa entre as notas médias das duas turmas? Explique sua 
resposta. 


Como as notas médias efetivas não foram utilizadas na resolução do Problema 
7.21, não importa quais sejam elas. Isto já era de esperar-se, porque não estamos procu- 
rando determinar se há diferença significativa entre as médias, e sim se há diferença signi- 
ficativa entre а variabilidade das notas. 


CURVAS CARACTERISTICAS DE OPERAÇÃO 


7.23. Referindo-nos ao Problema 7.2, qual a probabilidade de aceitar a hipótese de 


a moeda ser honesta quando a probabilidade efetiva de “сата” 6 0,7? 


p=05 »p=07 


60,5. 
caras caras 


Fig. 7-6 


A hipótese Hg de que a moeda é honesta, i.e., p=05, é aceita quando o número 
de caras ст 100 jogadas fica entre 39,5 e 60,5. A probabilidade de rejeitar Ay quando 
ela devia ser aceita (i.e., a probabilidade de um erro tipo I) é representada pela área total œ 
da região sombreada sob a curva normal à esquerda na Fig. 7-6. Tal como foi calculada 
no Probl 7.2(a), esta área 0, que representa о nível de significância do teste de Hp, é 
igual a 0,0358. 

Se a probabilidade de “cara” é 0,7, então a distribuição de caras em 100 jogadas é 
a representada pela curva normal à direita na Fig. 7-6. Vê-se que a probabilidade de acei- 
tar Но quando efetivamente р —0,7 (i.e.,a probabilidade de um erro tipo II) é dada pela 
área Й, hachurada. Para calcular esta área, observamos que a distribuição, sob a hipótese 
p=0,7, tem média e desvio padrão dados por 


H= пр = (100) (0,7) = 70 o = Упра = У(100)(0,7)(0,3) = 4,58 
60,5 em unidades padronizadas — 60,5 —10 —2,07 
4,58 д 


39.5 ет unidades padronizados = 395 —— = gen 
4,58 
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Então f= área sob a curva normal entre z— —6,66 e z=-207 = 0,0192 


Assim, com а regra de decisão adotada, é muito pequena a chance de aceitar Ho 
quando, efetivamente, p —0,7. 

Note-se que, neste problema, foi dada a regra de decisão que nos permitiu calcular 
ое b. Na prática, podem surgir duas outras possibilidades: 
(1) Fixamos @ (0,05 ou 0,01), chegamos a uma regra de decisão, e calculamos (f. 
(2) Fixamos Q е f e então formulamos uma regra de decisão. 


7.24. Faça o Problema 7.23 se (a) р = 0,06 (b) p= 0,8, (c) p= 0,9,(d)p = 0,04. 


(a) Sep —0,6, a distribuição de caras tem média e desvio padrão dados рог 


к = np = (100)(0,6) = 60 с = vapa = У(100)(0,6)(0,4) = 4,90 


60,5 em unidades padronizadas 0,102 
39,5 em unidades padronizadas —4,18 
Então [ = área total sob a curva normal entre z — —4,18 e 2=0,102 = 0,5405 


Assim, com base na regra de decisáo adotada, há grande chance de aceitar a 
hipótese de a moeda ser honesta mesmo quando p — 0,6, efetivamente. 
(b) Sep= 0,8, então — 
p= np = (100)(0,8) = 80 с = Упра = ү(100)(0,8)(0,2) = 4. 
60,5 — 80 


60,5 em unidades padronizadas — 4 = —4,88 


39,5 em unidades padronizadas — E = -—10,12 


Então = área sob a curva normal entre ¿=—10,12 .e #=—488 = 0,0000 


(c) Por comparação com (Б), ou por cálculo, vemos que se p = 0,9, $=0 para fins 
práticos. 
(d) Por simetria, p= 0,4 dá o mesmo valor de В que p= 0,6, isto é, B= 0,5405. 


7.25. Represente os resultados dos Problemas 7.28 e 7.24 construindo um gráfico 
de (а) б em função de p, (b) (1 — 8) em função de p. Interprete os gráficos 
obtidos. 


A Tábua 7-3 dá os valores de f correspondentes aos valores dados de p, tais como 
obtidos nos Problemas 7.23 e 7.24. 


ku: 
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Note-se que À representa a probabilidade de aceitar a hipótese p= 0,5 quando 
efetivamente p tem valor diferente de 0,5. Todavia, se é verdade que р = 0,5, podemos 
interpretar $ como a probabilidade de aceitar p= 0,5 quando tal hipótese deve ser 
aceita. Esta probabilidade é iguala 1 — 0,0358 = 0,9642, e consta da Tábua 7-3. 


Tábua 7.3 --- 


0.5 


6 


0.6405 


1:97 о = 0,0868 (a) 


f 1—17 TP Fig. 


£ ЖШ 
а = 0,0858 
BEES 


0 0,2 04 9,6 0,8 10 
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(a) O gráfico de 8 em função de p (Fig. 7-7(a)) chama-se curva característica de opera- 
ção, ou CO, da regra de decisão ou teste de hipótese. 

A distância do ponto máximo da curva CO à reta = 1 6 igual a 00= 0,0358, nível 
de significância do teste. 

Em geral, quanto mais acentuado o pico da curva CO, melhor é a regra de decisão 
para rejeitar hipóteses que não são válidas. 

(b) O gráfico de (1 — B) em função de p (Fig. 7-7(5)). chama-se curva de poder da regra 
da decisão ou do teste. Esta curva é obtida simplesmente invertendo-se a curva со, 
de modo que, na reatidade, ambos os gráficos se equivalem. 

A quantidade 1 — fi costuma chamar-se função de poder, pois indica a capacidade, 
ou poder, de um teste, para rejeitar hipóteses que são falsas, isto é, que devem ser 
rejeitadas. A quantidade f é também chamada função característica de operacão de 
um teste. 


7.26. Uma companhia fabrica cordas cuja resistência média é de 300 Ibs., com des- 
vio padrão de 24 lbs. Pretende-se que um novo processo de fabricação possa 
aumentar a resistência média. (a) Estabeleça uma regra de decisão para rejei- 
tar o processo antigo, ao nível de significância de 0,01, com base em uma 
amostra de 64 cordas. (b) Sob a regra de decisão estabelecida em (a), qual a 
probabilidade de aceitação do processo antigo, no caso de o novo processo 
contribuir realmente para aumentar a resistência média para 310 1bs.? 
Admita que o desvio padrão é ainda de 24 Ibs. 


(a) Sej é a resistência média, desejamos decidir entre as hipóteses 

300 Ib, e o novo processo é equivalente ao antigo 

Ну р > 300 lb, e o novo processo é melhor do que o antigo 
Para um teste unilateral ao nível de 0,01, temos a seguinte regra de decisão (ref. 
à Fig. 7-8): 
(1) Rejeitar Hg se o escore z da resistência média amostral é superior a 2,33. 
(2) Aceitar Hy em caso contrário. 

= u _ X-— 800 


olyn canoa" 
se Z > 2,338, X > 800 + 3(2,23) = 307,0 1p. 


Сото Z = X = 300+ 37. Então, 


Fig. 7-8 


Assim, a regra de deci 5 
(1) Rejeitar H se a resistência média das 64 cordas exceder 307 105, 
(2) Aceitar Hg em caso contrário. 
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(b) Considere as duas hipóteses (Ho: u — 3001b) e (H,: н — 310 Ib). As distribuições 
das resisténcias correspondentes a essas duas hipóteses achamrse representadas 
respectivamente pelas distribuições normais à esquerda e à direita, na Fig. 7-9. 


ce < 
200 1b 307 1b 310 lb 


Fig. 7-9 


A probabilidade de aceitar o processo antigo quando a nova resistência média é de 
fato 310 lbs. acha-se representada pela região de área В па Fig. 7-9. Para determinar 
essa área, note que 307,0 lbs. em unidades padronizadas equivale a 

(307,0 — 310)/3 = — 1.00; 
logo В = área sob a curva normal da direita à esquerda de z = —1,00 = 0,1587, 
Esta é а probabilidade de aceitar (Ну: к = 8001h) quando, na realidade, 
(Ну: u =8101b) é verdadeira, isto é, a probabilidade de cometer um erro tipo П. 


7.27. Construa (a) uma curva CO e (b) uma curva de poder para o Problema 7.26, 


admitindo que o desvio padrão da resistência das cordas permaneça igual a 
24 lbs. 


Mediante raciocínio análogo ao utilizado no Problema 7.26(b), podemos deter- 
minar В para оз casos em que o novo processo proporciona resistência média 4 igual а 
305 Ibs., 315 lbs., etc. P.ex., se и = 305 lb, então 307,0 Ibs. em unidades padronizadas 
é igual а (307,0 — 305)/3 = 0,67, donde 8= área sob a curva normal da direita, à 
esquerda dez = 0,67 = 0,7486. Obtém-se então a Tábua 7-4. 


Tábua 7-4. 


300 305 310 315 320 


| 
В | 1,0000 | 1,0000 | 0,9900 | 0,7486 | 0,1587 | 0,0038 одо | 


(a) 


y (lb) 


290 205 300 305 310 315 320 
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(b) 


/ -om u (Ib) 


7.28. 


T T T T 
200 205 300 305 310 315 320 


Fig. 7-10 


(a) А Fig. 7-10(4) exibe a curva CO. Por ela vé-se que a probabilidade de manter o 
processo anterior, sc a nova resistência é inferior a 300 Ibs., é praticamente 1 (exceto 
quanto ao nível de significáncia de 0,01, quando o novo processo dá uma resistên- 
cia média de 300 Ibs.). A probabilidade decresce então rapidamente para zero, de 
forma que náo há praticamente nenhuma chance de manter o processo antigo de fa- 
bricação quando a nova resistência média é superior a 315 lbs. 

(b) A curva de poder da Fig. 7-10(b) é suscetível exatamente da mesma interpretação 


que a curva CO. De fato, ambas as curvas são, em essência, equivalentes. 


Para testar a hipótese de que uma moeda é honesta (Le., p= 0,5) através de 
certo número de jogadas, desejamos impor as seguintes restrições: (4) A pro- 
babilidade de rejeitar a hipótese quando ela é de fato correta não deve exce- 
der 0,05; (B) a probabilidade de aceitar a hipótese quando p difere de 0,5 
por 0,1 ou mais (ie., p > 0,6 ou p< 04) deve ser de 0,5 no máximo, Deter- 
mine o tamanho mínimo da amostra necessária e formule a regra de decisão. 


Aqui impusemos limites aos erros dos tipos I e 11. P.ex., a restrição (4) exige que 
a probabilidade de um erro tipo I seja, no máximo, « = 0,05 enquanto que a restrição 
(B) exige que a probabilidade de um erro tipo П não exceda 8 = 0,05. A situação 
acha-se ilustrada graficamente na Fig. 7-11. 


Fig. 7-11 
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Seja n o tamanho da amostra necessária e x o número de caras em n jogadas, 
acima do qual xeieitamos a hipótese р = 0,5 Pela Fig. 7-11, 


dra ah " Ds à direita de EP = ШЕ ш 0,098 
(1) Área sob a curva normal para p = 0.5 à direita de, NI 0,5». TUUM 
(2) Área sob a curva normal para p = 0,6 à esquerda de ? 0,05. 


Na realidade, deveríamos ter igualado a ёгса entre 


бб» 


0,49 ул. 


(па) — 0,67 E 
m^ m e 
0,49 Vn 

a 0,05; entretanto, (2) constitui boa aproximação. Note-se que tomando como probabi- 
lidade de aceitação 0,05 no “pior caso”, р = 0,6, automaticamente fazemo-la igual a 
0,05 ou menos, quando p tem qualquer outro valor exterior ao intervalo 0,4 a 0,6. 
Logo, uma média ponderada de todas essas probabilidades, que representa a probabili- 
dade de um erro tipo II, também será 0,5 ou menos. 


De (1), 5— 95? — 196 ou (8) 2=0,52+0,980/7. 
Q5vn 


0,6 м 
2069 1645 ou (4) x = (6n — 0,806. 
0,49/% ý ios i 3 
Então, de (3) e (4), n= 318,98. Segue-se que o tamanho da amostra deve ser, 
pelo menos, 319, isto é, devemos jogar а moeda pelo menos 319 vezes. Fazendo п = 319 


em (3) ou (4), vem x = 177. 


De (2), 


Para p= 0,5, x — пр= 177 — 159,5 = 17,5. Adotamos então a seguinte regra 
de decisão: 
(a) Aceitar a hipótese p= 0,5 se o número de caras em 319 jogadas está no intervalo 
159,5 +17,5, ou seja, entre 142 c 177. 
(b) Rejeitar a hipótese em caso contrário. 


CARTAS DE CONTROLE DE QUALIDADE 


7.29. Constrói-se uma máquina para fabricar mancais de diâmetro médio de 0,574 
polegadas, com desvio padrão de 0,008 polegadas. Para determinar se a máqui- 
na está em boas condições de funcionamento, toma-se uma amostra de 6 man- 
cais cada duas horas, e calcula-se o diámetro médio dessa amostra. (a) Formu- 
le uma regra de decisão que permita estarmos razoavelmente certos de que a 
qualidade do produto está conforme as especificações. (Б) Mostre como re- 
presentar graficamente a regra de decisão estabelecida em (a). 


(a) Com 99,73% de confiança podemos dizer que a média amostral X deve estar no 
intervalo 
(ия — Заў) а ¡(nz + Sog) ou (u— 30/45.) а (и + Bo/ Vm). 


Como u=0,574,0=0,008 e n=6, 


(b 


0,584 


0,574 


0,564 
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segue-se que, com 99,737 de confiança, a média amostral deve estar entre 

(0,574 — 0,024//8) е (0,574-+0,024/V6), ou seja, entre 0,564 e 0,584 

polegadas. 

Donde a nossa regra de decisão: 

(1) Aceitar a hipótese de que a máquina está em boas condições se a média amostral 
estiver no interior do intervalo 0,564 a 0,584 pols. 

(2) Em caso contrário, concluir que a máquina não está em boas condições, e procu- 
тат determinar as causas. 

) Podem-se registrar as médias amostrais por meio de uma carta como a da Fig. 7-1 2. 
chamada carta de controle de qualidade. Cada vez que se calcula uma média amos- 
tral, representamo-la por um ponto. Enquanto os pontos se situarem entre os limi- 
tes inferior de 0,564 e superior dc 0,584 pols., o processo está sob controle. Quan- 
do um ponto sai desses limites (tal como ocorreu com a terceira amostra de quinta- 
feira), há possibilidade de algo estar crrado, sendo aconselhável uma. investigação. 

Os limites de controle especificados acima chamam-se limites de confiança de 
99,73%, ou, abreviadamente, limites de 30. Todavia, podem-se determinar também 
outros limites de confiança, como 99%, 95% ctc. A escolha em cada caso depende 
de circunstâncias particulares. 


2% feira 33 feira 48 feira 6ê feira 


AJUSTAMENTO DE DADOS POR MEIO 
DE DISTRIBUIÇÕES TEÓRICAS 


7.30. Ajuste uma distribuição binomial aos dados do Problema 5.30, pág. 250. 


q 


Temos Р(х caras em uma jogada de 5 moedas) = f(x) = ;C,p*q^-7, ondepe 
são respectivamente as probabilidades de cara e de coroa em uma jogada, O número 


médio ou esperado de caras é и = np = бр. 


Para a distribuição observada, o número médio ds caras é dado por 
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Efe _ (88X0) + (144)(1) + (342)(2) + (287)(3) + (164)(4) + (25)(5) 


_ 2470 


27 1000 
= 2,47 


^ 1000 


Igualando as médias teórica e observada, 5p = 2.47 ou p = 0.494. Assim, a distribui- 
ção binomial ajustada é dada por /(x) = 5C,(0.494)7(0.506)5- 7. 

A Tábua 7-5 relaciona essas probabilidades, bem como as frequências esperadas 
(teóricas) e observadas. O ajustamento é bom. A aderência é investigada no Problema 


743. 
Tábua 7-5 
Número de caras, А Freqüéncia Freqüéncia 
x Р(х caras) Esperada Observada 
0 0,0332 33,2 ou 33 38 
1 0,1619 161,9 ou 162 | 144 
2 0,3162 3162 ou 316 342 
8 0,3087 308,7 ou 309 287 
4 0,1507 150,7 ou 151 164 
5 0,0294 29,4 ou 29 25 
i 
7.31. Use o papel de probabilidade para determinar se a distribuição de frequência 


da Tábua 5-2, pág. 229, pode ser satisfatoriamente aproximada por uma dis- 


tribuição normal. 


Tábua 7-6 


Altura (pols.) 


Menos de 
Menos de 645 
Menos de 67,5 
Menos de 70,5 


Menos de 73,5 


Freqüéncia Relativa 
Acumulada 


(5 


23,0 
65,0 
92,0 


100,0 


| 
| 
| 
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Primeiro transforma-se a distribuição de freqüência dada em uma distribuição 
cumulativa, tal como na Tábua 7-6. Em seguida as fregüéncias acumuladas, expressas 
como percentagens, são marcadas em relação aos limites de classe superiores, em papel 
especial de probabilidade, tal como se vê na Fig. 7-13. O grau de aproximação entre o 
gráfico constituído por esses pontos e o gráfico de uma reta dá a medida da aderéncia da 
distribuigáo considerada a uma distribuigáo normal. Vê-se, no caso, que a distribuição 
normal se ajusta bem aos dados observados (v. Problema 7.32 ). 


99,9 


Freqüéncia Relativa Acumulada (%) 
E 


65,5 — 085 T8 — 745 


Altura (pols.) 
Fig. 7-13 
7.32. Ajuste uma curva normal aos dados da Tábua 5-2, pág. 229. 


Tábua 7-7 
rm 
Alturas Feortettos | Area suba Área para | Frequência |Freqüência 
" de Classes Fronteiras Curva Nor- А 
(pols.) cada Classe | Esperada |Observada 
de Classes malde 0 az 
| 
59,5 -2,72 0,4967 
60—62 0,0413 4,13 0u 4 8 
62,5 -1,70 0,4554 
63-65 | 0,2068 20,68 ou 21 18 
65,5 —0,67 0,2486 
66—6 Ad > 0,3892 38,92 ou 39 42 
| 68,5 0,36 0,1406 
| 69-71 0,2771 27,11 ou 28 27 
| 71,5 1,39 0,4177 
| 72-14 0,0743 743ou 7| 8 
| 74,5 2,41 0,4920 
X = 61,45 pols. $ = 2,92 pols, 


k 
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7.33. 


Pode-se organizar o trabalho como na Tábua 7-7, Ao calcularmos z para 05 limites 
de classe, utilizamos г = (w— &)/s onde a média X e o desvio padrão s foram obtidos, 
respectivamente, nos Problemas 5,35 e 5.40. 

Na quarta coluna, as áreas sob a curva normal de 0 a z foram obtidas com auxílio 
da Tábua do Apêndice C. Daí podemos achaz as áreas sob a curva normal entre valores 
sucessivos de z, como na quinta coluna. Tais valores obtém-se subtraindo as áreas sucessi- 
vas na quarta coluna quando os z's correspondentes são de mesmo sinal, c somando-as 
quando os z's têm sinais contrários (o que ocorre somente uma vez na tábua). A razão 
para isto é óbvia, a partir do diagrama. 

Multiplicando os valores da quinta coluna (que representam frequências relativas) 
pela fregüéncia total п (no caso, n = 100), obtém-se as freqüéncias teóricas ou esperadas 
(sexta coluna). Vê-se que há boa concordância com as frequências observadas da quinta 


coluna. 
A “aderência do ajustamento” da distribuição é tratada no Problema 7.44. 


A Tábua 7-8 exibe o número f de dias, em um período de 50 dias, durante os 
quais ocorreram x acidentes de automóvel em determinada cidade. Ajuste 
uma distribuição de Poisson aos dados. 


Tábua 7-8 


Número de 
dias f 


Número de 


acidentes x 


21 


TOTAL 50 


O número médio de acidentes é 


, = Efe . (2100) + аву) + (12) + 9X9) + CNA) 
37 50 
— 45 
— E 0,90 
Então, de acordo com a distribuição de Poisson, 


Ple acidentes) = (Petr 


A Tábua 7-9 relaciona as probabilidades para 0, 1, 2, 3 e 4 acidentes, tais co- 
mo obtidas dessa distribuição de Poisson, bem como o número teórico de dias durante os 
quais ocorrem x acidentes (obtidos multiplicando-se por 50 as probabilidades respecti- 
vas), Por conveniência de comparação, repete-se a quarta coluna que dá os números ob- 
servados de dias. 
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Tábua 7-9 


Número de 4 " 
" Nümero Esperado Nümero Observado 
i P idi A 
o Charentes) de Dias de Dias 


20,83 ou 20 


18,30 ou 18 
8,24 ou 
2,47 ou 
0,56 ou 


Vê-se que o ajustamento da distribuição de Poisson aos dados é boa. 

Para uma verdadeira distribuição de Poisson, o? = à. O cálculo da variância da 
distribuição considerada dá 0,97, valor satisfatoriamente próximo de 0,90 para À, o que 
constitui mais uma evidência da boa aderência do ajustamento da distribuição de Poisson 
aos dados. 


O TESTE QUI--QUADRADO 


7.34. Em 200 jogadas de uma moeda, observaram-se 115 caras e 85 coroas. Teste a 
hipótese de que a moeda é honesta, ao nível de significância (a) de 0,05, 
(b) de 0,01. 


Freqüéncias observadas de caras e coroas: % = 115, х5 = 85. 
Se a moeda é honesta, as fteqüéncias esperadas (teóricas) de caras e coroas são 
np, = 100, np, = 100 respectivamente, Então 
à — Gan (um? (11510072 + (85—100)2 
de Api npa 100 100 


4,50 


Como o número de categorias. ou classes (caras, coroas) é 
k=2, »=k-1=2-1=1, 
(a) О valor crítico de без para 1 grau de liberdade é 3,84. Então, como 4,50>3,84 
rejeitamos a hipótese de que a moeda é honesta, ao nível de 0,05. 
(b) O valor crítico de X099 para 1 grau de liberdade é 6,63. Então, como 4,50 < 6,63, 
não podemos rejeitar a hipótese de que a moeda é honesta, ao nível de 0,01. 
Concluiríamos então que os resultados observados são provavelmente significati- 
vos, e que a moeda é provavelmente honesta. 
Para uma comparação deste método com métodos previamente utilizados, cf. 
Problema 7.36, Método 1. 
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135; 


Faça o Problema 7.34 aplicando a corteção de Yates, 


(zm — 05) | (аз — пра — 0,52 


2 igid = 
x? (corrigido) И арт тра 
15100052 , (B5—100 — 98? _ (145? , (145% _ ¿a 
= 100 ш 100 ш ш ш. 


736. 


727. 


Como 4,205 2‹ 2,84 e 4,205 < 6,63, as conclusões а que chegamos no Pro- 
blema 7.34 são válidas. 
Para comparação com métodos previamente utilizados, cf. Problema 7.36, 
Método 2. é 


Faça o Problema 7.34 aproximando a distribuição binomial por uma distribui- 
ção normal. 


Na hipótese de a moeda ser honesta, a média e o desvio padrão do número de 
caras em 200 jogadas de uma moeda são 


и = np = (200)(0,5) = 100 с = Упра = V(200)(0,5)(0,5) = 7,07. 


Método 1. 
115 caras em unidades padronizadas = (115 — 100)/7,07 = 2,12. 


Utilizando um nível de significância de 0,05 e um teste bilateral, геј eitaríamos а 
hipótese de a moeda ser honesta se о escore 2 fosse exterior ao intervalo —1,96 a 1,96. 
Ao nível de 0,01, o intervalo correspondente seria de -2,58 22,58. Segue-se (tal como no 
Probl. 7.34) que podemos rejeitar a hipótese ao nível de 0,05 mas não podemos rejeitá-la 
ao nível de 0,01. 

Note-se que o quadrado do escore padronizado acima, (2,12)? = 4,50, é o mes- 
mo valor de X? obtido no Problema 7.34. Este é sempre o caso para um teste qui-quadra- 
do envolvendo duas categorias. V. Problema 4.36, 


Método 2. 


Utilizando a correção de continuidade, 115 ou mais caras equivalem a 1145 ou 
mais caras, Então, 114,5 em unidades padronizadas = (114,5 — 100)/7,07 = 2.05, o 
que conduz às mesmas conclusões do primeiro método. 

Note-se que o quadrado desse escore padronizado é (2,05)! = 420, que é o 
valor de X? com a correção de continuidade (correção de Yates) do Problema 7.35. Este 
é sempre o caso para um teste qui-quadrado envolvendo duas categorias, no qual se tenha 
aplicado a correção de Yates — novamente em consegüéncia do Problema 4.36. 


A Tábua 7-10 exibe as freaüéncias observadas e esperadas em 120 jogadas de 
um dado. Teste a hipótese de que o dado é honesto, utilizando um nível de 
significância de 0,05. 
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Tábua 7-10 


Face 6 
Fregiiência 16 
Observada 
P edu 20 | 20 | 20 
Esperada 
(ap)? (ap, (ва тра): (а пра) (esmo (mena? 
ND пр» "ps npa "9s "ps 
(25 — 20)? 401 20)? + (15 — 202 E (23 — 20)2 | (24202 (16—20)? 
20 20 20 20 20 20 
5,00 


Como o número de categorias ou classes (faces 1, 2, 3, 4, 5, 6) é Kk=6, 


v=k-1=6-1=5. 


O valor crítico Xãos рата 5 graus de liberdade é 11,1. Então, сото 5,00 < 11,1, 
não podemos rejeitar a hipótese ao nível 0,05 
Para 5 graus de liberdade, Хдо; = 1,15, de modo que x? = 5,00 > 1,15. Segue- 
se que a concordância não é assim tão excepcionalmente boa a ponto de despertar 


suspeitas. 


. Uma tábua de 250 números aleatórios acusa a distribuição dos dígitos O, 1, 
2,...,9 exibida na Tábua 7-11. A distribuição observada difere significativa- 
mente da distribuição esperada? 


Tábua 7-1] 


Freqüéncia 
Observada 
Frequência 
Esperada 
(17—252 , (31—25)? (29 — 25)? (18 — 25)? mer — 25) 
us Е т шо 25 


25 


= 238 
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O valor crítico }бәе|рага » = k — 


= 9 graus de liberdade 6 217,8 23,3>21,7, 


Logo, concluímos que a distribuição observada difere significativamente da distribuição 
esperada, ao nível de 0,01. Segue-se que não se pode considerar a tábua totalmente 


aleatória. 


7.39. Em seus experimentos com ervilhas, Mendel observou 315 lisas e amarelas, 
108 lisas e verdes, 101 estriadas e amarelas, 32 estriadas e verdes. De acordo 
com sua teoria da hereditariedade, os números deveriam apresentar-se na 
proporção 9:3:3:1. Há evidência para duvidar dessa teoria, ao nível de 


(a) 0,01, (b) 0,05? 


O número total de ervilhas é 315 + 108 + 101 + 32 = 556. Como os números 


esperados estão na proporção 9:3:3:1 (e 9 + 3+3+1)=16), esperaríamos 


30650) = 312,75 lisas e amarelas 


658) = 104,25 estriadas e amarelas 


ien — 104,25 lisase verdes 
(550) = 34,75 estriadas e verdes 
Entáo 
„ _ (S15— 312,752 , (108—104,25)2 | (101—104,25)2 | (3234,75): 
És v - 4,15)? 
312,75 104,25 10425 34,76 
= 0,470 


Como há quatro categorias, k = 4 e o número de graus de liberdade é v=4-—1=3. 


(a) Para »=3, Xésos- 11,8 de modo que não podemos rejeitar a teoria ao nível 


de 0,01. 


(b) Para »— 8, Xóss— 7,81 de modo que não podemos também rejeitar a teoria ао 


nível de 0,05. 
Concluímos então que a teoria e o experimento concordam. 
Note-se que, para 3 graus de liberdade, 0,05 = 0,352 e X 


2 = 0,470 > 0,352. 


Assim, embora a concordância seja boa, os resultados obtidos estão sujeitos a um 


certo erro de amostragem. 


7.40. Uma urma contém um número muito grande de bolas de quatro cores: verme- 
lha, laranja, amarela e verde. Uma amostra aleatória de tamanho 12, extraída 


741. 
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da uma, acusou 2 vermelhas, 5 laranja, 4 amarelas e 1 verde. Teste a hipótese 
de que a urna contém proporções iguais das bolas das diferentes cores. 


Sob a hipótese de que a uma contém proporções iguais das diferentes cores, 
esperaríamos 3 bolas de cada cor em uma amostra de 12. 

Como esses números esperados são inferiores a 5, a aproximação quiquadrado é 
falha. Para evitar isto, combinamos categorias de modo que o menor número esperado 
em cada categoria seja 5. 

Se desejamos rejeitar a hipótese, devemos combinar categorias de modo a realçar 
a evidência contra a hipótese. Em nosso caso, conseguimos isto considerando as duas 
categorias “vermelho ou verde” e “laranja ou amarelo”, cujos valores amostrais são 3 e 9, 
respectivamente. Como o número esperado em cada categoria agora é 6 (sob a hipótese 
de proporções iguais) temos А (8—6)? (9-62 _ 

д = =8 

Para » = 2—1 — 1, x%s = 3,84. Assim, não podemos rejeitar a hipótese ao 
nível de 0,05 (embora possamos rejeitá-la ao nível de 0,01). Pode-se admitir que os resul- 
tados observados sejam devidos ao acaso mesmo quando estejam presentes iguais propor- 
ções das quatro cores. 


Outro método. Aplicando a correção de Yates, obtemos 
(8—6|— 05? | (9-6|-0,52 _ (252 am (2,52 
6 : 6 6 6 


a = = 21 


, 9 que conduz à mesma conclusão acima. Isto já era de esperar-se, pois a correção de 


Yates sempre reduz o valor de x?. м 
Note-se que, utilizando a aproximação Х a despeito de as fregüéncias serem 
demasiadamente pequenas, obteríamos 
(2 — 3)2 (5 – 3)? (4—8)? (1-3)? 
2 c : = 8,483 
x “з оа 8, 


Como, parar = 4 — 1 = 8, ss = 7,81, chegaríamos às mesmas conclu- 
sões que acima. Infelizmente, a aproximação Ж para pequenas fregiiências é pobre; 
portanto, quando não é aconselhável combinar freqüéncias, devemos recorrer aos méto- 
dos exatos envolvendo a distribuição multinomial. 


Em 360 jogadas de um par de dados, observaram-se 74 “sete” e 24 “onze”, 
Ao nível de significância de 0,05, teste a hipótese de que os dados são 
honestos. 


Uma jogada de um par de dados pode dar 36 resultados distintos. O “sete” pode 
ocorrer de 6 maneiras, o “onze” de duas. 2 1 

Então, P (“sete”) = S s є eP ("onze") = 36 = 1g . Assim, em 360 jogadas, 
esperaríamos-1-(360) =60 setes e 8s (360) = 20 onzes, de modo que 


› _ (74—60)? , (24—20)2 
2 £o WI ER. D WC sa 
E 0 1 07 


Para ›= 2—1 = 1, Xos = 3,84 Então, como 4,07 > 3,84, estaríamos in- 
clinados a rejeitar a hipótese de os dados serem honestos. Aplicando, entretanto, a corre- 
ção de Yates, obtemos 
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2 aê _ 074—601 – 0,5)? (|24 — 20| — 059 _ (35) (3,5)? 
x? (corrigido) = qo + 20 = су + 
= 3,65 


Assim, com base no valor corrigido de №, não poderíamos rejeitar а hipótese ao 
nível de 0,05. 

Em geral, para grandes amostras, como no caso presente, os resultados corrigidos 
segundo Yates costumam ser mais exatos do que os náo-corrigidos. Todavia, como mes- 
mo o valor corrigido de y? está tão próximo do valor crítico, hesitamos cm tomar 
qualquer decisáo. Em tais casos, o melhor é aumentar O tamanho da amostra, fazendo 
maior número de observações, especialmente se estamos interessados no nível de 0,05. 
Doutra forma, rejeitaríamos a hipótese a um outro nível (como, p.ex., 0,01). 


Uma pesquisa feita junto a 320 famílias de 5 filhos cada acusa a distribuição 
exibida na Tábua 7-12. Tais resultados são consistentes com a hipótese de 
igual probabilidade de nascimento para ambos os sexos? 

Tábua 7.12 


Número de | 5 meninos | 4 meninos |3 meninos | 2 meninos | 1 menino O menino [TOTAL 
Meninos e | 0 meninas |1 menina |2 meninas | 3 meninas |4 meninas | 5 meninas 


Meninas 
Número de 
famílias 18 56 110 88 40 8 sa 


Seja p= probabilidade de nascimento de menino e q = 1-р = probabilidade de 
nascimento de menina, Então as probabilidades de (5 meninos), (4 meninos — 1 menina), 
..., (5 meninas) são dados pelos termos do desenvolvimento binomial 

(pro = р> + Брід + 10p3a? + 10p?g? + Spa + 4° 


Se p=a=% temos 
Р(5 meninos - 0 menina) 
P(4 meninos - 1 menina) 
P(3 meninos - 2 meninas) 
P(2 meninos - 3 meninas) ` 


P(1 menino - 4 meninas) 


Р(0 menino -5 meninas) 


Então, o número esperado de famílias com 5, 4, 3, 2, 1 е 0 meninos se obtém 
respectivamente multiplicando-se as probabilidades acima por 320; os tesultados são 10, 
50, 100, 100, 50, 10. Logo 

(18—10)2 , (56 — 50)? b (110 — 100)? 4. (88 — 100)? , (40 — 50? , (8— 10)? 

10 ^ 50 100 100 —' 50 | 10 

= 120 
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Como 
es = 11,1 e Жәр= 151 рша v=6-1=5 
graus de liberdade, podemos rejeitar a hipótese ao nível de 0,05, mas não ao nível de 
0,01. Concluímos, pois, que os resultados são provavelmente significativos, e que os nas- 


cimentos de menino e menina não são igualmente prováveis. 


ADERÉNCIA DO AJUSTAMENTO 


7.43. Use o teste qui-quadrado para determinar a aderência do ajustamento aos da- 
dos do Problema 7.30. 
S (38 — 33,2)? 4 = 161,9) , (342 — 316,292 ж, (287 — 308,7)? , (164 — 150,7)2 
® 38,2 : 161,9 316,2 : 308,7 150,7 
(25 — 29,4)? 
29,4 


+ = TAS 


Como o número de parâmetros usados na estimativa das freqiiências esperadas é 
m= 1 (asaber, o parámetro p da distribuição binomial), 
»r=k-l-m=6-1-1=4, 


Para › = 4, Xo9s = 9,49. A aderência é boa. 
Para » = d,Xã0s = 0,711. Como Х =7,45 20,711, a aderência não é tão boa. 
7.44. Determine a aderência do ajustamento aos dados do Problema 7.32. 
2 — (6—443? , (1820682 | (42—38,92? | (Z1 27,71)? , (8— 1,43) 


X = Tag К 23068 ^ 38,92 aa as 


0,959 е КРӨ ч 
Como o número de parámetros usados na estimativa das freqüéncias esperadas é 


m= 2 (a saber, a média ge o desvio padrão O da distribuição normal), »= k — 1 — 
-m=5-1-2=2. 
Para v = 2, hos = 5,99, А aderência é muito boa. 


Para › = 2, д; = 0,103, Сото x? = 0,959 > 0,103, a aderência não é tão boa. 


TABELAS DE CONTINGÊNCIA 
7.45. Faça o Problema 7.13 utilizando um teste qui-quadrado. 


A Tábua 7-13 dá as condições do problema. Sob a hipótese nula Hg de que o 
soro não produz efeito, esperaríamos que, em cada grupo, 70 pacientes se curassem e 30 
não se curassem, tal como indicado na Tábua 7-14. Note-se que Ho equivale à asserção de 
que a сша é independente do uso do soro, i.e., as classificações são independentes. 


346 PROBABILIDADE E ESTATISTICA 


= Tábua 7-13 
FREQUENCIAS OBSERVADAS 


Grupo À 
(usado o soro) 


Grupo B 
(não usando soro) 


Tábua 7-14 
FREQUÊNCIAS ESPERADAS SOB Hg 


Não 
Curados | Curados | TOTAL 


70 | 30 100 
f 
70 80 100 
[ш | в |] 


(15—10)? , (65—709 , (25—80): , (85 —80)2 _ 
V ^ d» * ' 8 py en 


Grupo À 
(usando o soro) 


Grupo В 
(nào usando o soro) 


xt 


Para determinar o nümero de graus de liberdade, consideremos a Tábua 7-15, que 
6 a mesma que as Tábuas 7-13 c 7-14, exceto quanto ao fato que só figuram os totais É 
óbvio que temos a liberdade de colocar um. só número em qualquer uma das quatro 
células vazias, pois, feito isto, os demais nümeros ficam univocamente determinados a 
partir dos totais indicados. Assim, há um grau de liberdade. 


Tábua 7-15 


Náo 
Curados 


Como Хх. = 3,84 para 1 grau de liberdade, e como х? = 2,38 < 3,84, con 
cluímos que os resultados não são significativos ao nível de 0,05. Não podemos, assim, 
rejeitar Но a este nível, e então concluímos ou que o soro não é eficiente, ou não formu- 
lamos decisão até que tenhamos o resultado de novos testes. 
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Note-se também que X? = 2,88 é o quadrado do escore z = 1,54 obtido no 
Problema 7.13. Em geral, o teste qui-quadrado envolvendo proporções amostrais em uma 
tabela de contingência 2 x 2 é equivalente a um teste de significância de diferenças de 
proporções utilizando-se a aproximação normal, tal como na pág. 350. (v. Problema 
751). 

Note-se também que um teste uni-lateral com a distribuição xe equivalente a um 
teste bilateral utilizando-se Д2, pois, p.ex. х? > Xps corresponde x > Xo9sou 
X <- Xo9s.Como para tabelas 2 x 2 x é o quadrado do escore z, Xé o mesmo que z, 
nesse caso, Assim, a rejeição de uma hipótese ao nível de 0,05 utilizando-se uma distri- 


Ъпісӯо x? é equivalente à rejeição com um teste unilateral ao nível 0,01, utilizando-se z. 


7.46, Faça o Problema 7.45 utilizando a correção de Yates. 


(125 — 30] — 0,5)2 


(175 — 70| — 0,5)? ES (165 — 70| — 0,52 


2 Р 
х? (corrigido) 70 70 ++ 30 
(135 — 30| — 0,5% _ 
F 30 = 1,93 


Assim, as conclusões 2 que chegamos no Problema 7.45 são válidas. Já se podia 
prever isto, aliás, notando que a correção de Yates sempre diminui o valor de X. 


7.47. Na Tábua 7-16 indicam-se os números de alunos aprovados e reprovados por 
três professores, X, Y e Z. Teste a hipótese de que as proporções de estudan- 
tes reprovados pelos trés professores sáo iguais. 


.. Tábua 7-16 
FREQUÊNCIAS OBSERVADAS 


Sob a hipótese Ho de igualdade de proporções dos alunos reprovados pelos três, 
cada um dos professores aprovaria 85% е reprovaria 15% dos estudantes. A Tábua 7-17 
dá as fregiiéncias esperadas sob Ho. 


Tábua 7-18 
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Tábua 7-17 
FREQUÊNCIAS ESPERADAS SOB Ho 


sr. Y 


85% de 55 | 85% de 61 | 85% de 64 
= 4675 | = 51,85 | = 5440 


15% де 55 | 15% de 61 | 15 
=82 | = 9,15 


TOTAL 


Então 
gi es (50 — 46,75)? , (47 — 51,85)? " (56 — 54,40)? + (5— 825) # (14 — 9,15)? 
46,75 51,85 54,40 8,25 9,15 


Para determinar o número de graus de liberdade, consideremos a Tábua 7-18, que 
é a mesma que as Tábuas 7-16 e 7-17, exceto quanto ao fato de ali só figurarem os totais. 
É óbvio que temos a liberdade de colocar apenas um número em uma célula vazia da 
primeira coluna e um número em uma célula vazia da segunda ou terceira coluna, após о 
que todos os outros números ficarão automaticamente determinados a partir dos totais 
dados. Assim, pois. há dois graus de liberdade. 

Сото X695 = 5,99, não podemos rejeitar Но ao nível de 0,05. Note-se, todavia, 
que, como 20 4,01, podemos rejeitar Ho ao nível de 0,01, desde que estejamos 
dispostos a correr o risca de errar com 1 chance em 10. 


7.48, Mostre que, para uma tabela de contingência h X k (h> 1,k> 1), o número 
de graus de liberdade é dado por (A — 1Xk — 1). 


Há h + k — 1 totais independentes dos ИК elementos. Segue-se que o número de 
graus de liberdade é 
hk-(h+k-D=(t- 1-1) 
c.q.d. O resultado é válido se os parámetros da população, necessários para obtenção das 
fregliéncias teóricas, são conhecidos. Em caso contrário, faz-se necessário o ajustamento 
descrito em (b), pág. 312. 


7.49. A Tábua 7-19 representa uma tabela de contingência geral de 2 X 2. Mostre 
que 


Tábua 7-19 
RESULTADOS OBSERVADOS 


n(a;bs — abr)? 
NINMANR 
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Tábua 7-20 
RESULTADOS ESPERADOS 


nan 


maf n 


Tal como no Problema 7.45, os resultados esperados sob a hipótese nula encon- 
tram-se na Tábua 7-20. Entáo, 


" (ау —тутд/т)2 (аә — ngnA/m? (b, — n4ug/m)? — (bo — nong/m)? 
x = * + 
nnan пә /п n¡ng/n Ngipin 
Mas 
NNa (a, + b) (a, + аз) а — Gob, 
gh nex = a-— = 
E n " а + bi + ay + by n 
Analogamente, nma nip Taft ado — asb, 
dy — = b = = = ET 
= n n n n 


Assim, podemos escrever 


„ a [аб — abi a m [Gba — ab; з a [Gba — aby? 
x nma n ERA n Rip n 


IE г абз — tgb, V? 
тов n 


ou simplificando, 


n(a,bs — аз)? 2 nal 


(2) gm E ==== 
DUCUM agn aig 


onde А = а — agb, n= a; аз БЫ т = by, пу = at do, na 
= ор +0 пв = byt bo 


Aplicando-se a correção de Yates, (1) é substituído por 


nlla] — 4n)? 


° 3 — Es 
(2) x? (corrigido) CR 


7.50. Ilustre o resultado do Problema 7.49 para os dados do Problema 7.45. 


No Problema 7.45, а = 75, аз = 25, b, = 65, bo = 85, ny = 140, no = 60, 
na = 100, ng = 100, 
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=200; então (1 494 
en =200;entáo (1) do Problema 7.49 dá 200[(75)(35) — (25)(65)} 


x = qse) + 
Utilizando a correção de Yates, o resultado é o mesmo que o do Problema 7.46: 
a _ w(jmbs— ab, — 4n)? _ 200/](75)(85) — (25)(65)| — 100]? 
х (comigião) = EA = (1403(600(100)(100) 


= 1,93 


7.51. Mostre que um teste qui-quadrado envolvendo duas proporções amostrais é 
equivalente a um teste de significância de diferença de proporções utilizando 
a aproximação normal (v. págs. 304—305). 


Sejam P, e P, duas proporções amostrais c p a proporção populacional. Referin- 
do-nos ao Problema 7.49, temos 


(1) p= м = 2, 1-р, =>, isto É 
Me т 
e p= 1—р= => 
de modo que 
m M rings co. "PS Ы = m -P), by = na =P) 
(4 na = np, np = nq 
Usando (3) e (4), temos, do Problema 7.49, 
aba? n[n Pons Po) — vaPan РӘ 
n NN Ag Е К A NIRPAG а " 
nn, — Po? (Pi — Po? 


(pois n = ny + na) 


"pq = palm F ina) 


que é o quadrado da estatística Z dada em (10), pág. 305. 


COEFICIENTE DE CONTINGÊNCIA 


7.52. Determine o coeficiente de contingência para os dados da tábua de con- 
tingência do Problema 7.45. 


= | Е 238 т = 
€ = М ami ~ VOMITO = 0,1081 


7.53. Determine o máximo de С para todas as tabelas 2 X 2 que podem surgir do 
Problema 7.13. 
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Tábua 7-21 


Não 
Curados 


Curados 


Grupo À 
(com soro) 


Grupo В 
(sem soro) 


O máximo de C ocorre quando as duas classificações são perfeitamente dependentes 
ou associadas. Em tal caso, todos os que tomaram o soro se curarão, e nenhum dos que 
não o tomaram se curará. A tabela de contingência tem então o aspecto da Tábua 7-21. 

Como as freqiiéncias celulares — na hipótese de independência completa — são to- 
das iguais a 50 
(100 —50)2 | (0—50)2 , (0—50)? , (100 — 50)? 


E 50 j 50 50 50 
Então, o máximo de C é 


МЛ +n) = V200/(200 + 200) = 0,7071, 


= 200 


Em geral, no caso de dependência perfeita em uma tabela de contingência onde os 
números de linhas e de colunas são ambos iguais a k, as únicas frequências celulares não 
nulas ocorrem na diagonal da esquerda superior para a direita inferior. Em tais casos, 


Conte = V(k—1)/k (v. Problema 7.127). 


PROBLEMAS DIVERSOS 


7.54. Um instrutor propõe um teste do tipo “verdadeiro ou falso” envolvendo 10 
questões. Para testar a hipótese de que o estudante acerta “adivinhando”, 
adota-se a seguinte regra de decisão: (i) havendo 7 ou mais respostas certas, o 
estudante não está adivinhando; (ii) havendo menos de 7 respostas certas, o 
estudante está adivinhando. Determine a probabilidade de rejeição da hipó- 
tese no caso de ela scr correta. 


Seja p = probabilidade de uma questão ser respondida corretamente 
Probabilidade de x respostas certas em 10 = 1 C,p*q!? *, onde qg = 1— p. 
Então, sob a hipótese p = 0,5 (i.e., o estudante está adivinhando), 

P(T ou mais certas) = P(7 certas) + P(8 certas) + P(9 certas) + P(10 certas) 


" P1. qe Ф Чй 9 19 1 1 10 
„© (E + AES) 3) +1069 2 G uo + tuas 
EN ЖМ 
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Assim, a probabilidade de concluir que o estudante náo está adivinhando, quando, 
na verdade, ele está, é 0,1719. Tem-se aqui uma probabilidade de erro tipo L 


7.55. No Problema 7.54, determine a probabilidade de aceitar a hipótese p =0,5 
quando, na realidade, p = 0,7. 


Sob a hipótese p= 0,7. 
P(menos de 7 certas) = 1 — P(7 ou mais certas) 


= 1 — [9€:(0,7)(0,3) + 10C8(0,7)8(0,3)? + 10Cg(0,7)9(0,3) + яф = 0,3504 


7.56. No Problema 7.54, determine a probabilidade de aceitar a hipótese р = 0,5 
quando, na verdade (a) p = 0,6, (b) p = 058, (c) p = 09, (d) p = 04, 
(e)p 703, p 202, (f 70. 


(a) Sep= 0,6, а probabilidade procurada é dada por 
1 — [P( certas) +P(8 certas) + Р(9 certas) + Р(10 certas)] 
= 1— [шС1(0,6)1(0,4)9 + 1008(0,8)8(0,4)2 + 19C9(0,9)9(0,4) + 10C10(0,6)19] = 0,618 


Os resultados de (Б), (c), ... , (8) podem ser obtidos de modo análogo e acham-se 
indicados na Tábua 7-22, juntamente com o valor correspondente a p = 0,7 achado no 
Problema 7.55. Note-se que a probabilidade é denotada por $ (probabilidade de um erro 
tipo II). Incluímos também o valor para р = 0,5 dado por 8 = 1— 0,1719 — 0,828 
do Problema 7.54. 


Tábua 7-22 
plo | 02 | 0,3 | 04 | os | 06 | от | ов | o» 


B | 1,000 | 0,999 | 0,989 | 0,945 | 0,828 | 0,618 | 0,350 | 0,121 | 0,013 


7.57. Use o Problema 7.56 para construir o gráfico de f em função de p, curva 
característica da regra de decisão do Problema 7.54. 


O gráfico consta da Fig. 7-14. Note-se a semelhança com a curva CO do Problema 
7:27. 

Se tivéssemos feito o gráfico de (1 — B) em função de р, teríamos obtido а curva 
de poder da regra de decisão. 

O gráfico indica que a regra de decisão adotada é poderosa para rejeitar p = 0,5 
quando, efetivamente, p > 0,8. 
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fiz) 


B 


0,84 


05 


7.58. Em 6 jogadas de uma moeda, aparece “cara” seis vezes. Podemos concluir que 
a moeda é viciada (a) ao nível de 0,05, (b) ao nível de 0,01? Considere ambos 
os tipos de teste — unilateral e bilateral. 


Seja p a probabilidade de “cara” em uma única jogada da moeda. 
Sob a hipótese (Ho: p —0,5) (isto é, a moeda é honesta), 
. A queque 6б» 
Jiz) = Pía carasem 6 jogadas) = ¿Cz x) (s = 91 


Então, as probabilidades de 0, 1, 2, 3, 4, 5 е 6 caras são dadas respectiva- 


bi + 15 Z0 15 6 p 
mente рог са, gp ga Gd 64 ыт 9 uc 


tal como se ilustra na distribuição de probabilidade da Fig. 7-15, 


Teste Unilateral 
Aqui desejamos decidir entre as hipóteses (Ho: p=0,5) e (Hj p>0,5). 
Como P(6 caras) = s = 0,001562 eP(5 ou6 caras) = $; + = 0,1094, pode- 


mos rejeitar Ho ao nível de 0,05 mas não ao nível de 0,01 (isto é, o resultado obtido é 
significativo ao nível de 0,05 mas não ao nível de 0,01). 


Teste Bilateral 
Aqui devemos decidir entre as hipóteses (Hs: p —0,5) e (Hj: p»* 0,5). 


Como Р(5 ou 6 caras)= qq + g4 = 0,098125, podemos rejeitar Ho ao nível de 0,05 
mas náo ao nível de 0,01. 


A 
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7.59. Faça o Problema 7.58 se, nas seis jogadas, aparecem 5 caras. 


Teste Unilateral.. Como P(5 ou 6 caras) Etr == 0,1094, náo podemos 
rejeitar Hg ao nível de 0,05 ou 0,01. 


Teste Bilateral. Como Р(0 ou 1 ou 5 ou 6 caras) = 2(¿, 
rejeitar H ao nível de 0,05 ou 0,01. 


= 0,2188, não podemos 


7.60, Mostre que um teste qui-quadrado envolvendo apenas duas categorias é equi- 
valente a um teste de significância para proporções (v. pág. 305). 


Se Р é a proporção amostral da categoria 1, p é a proporção populacional e n ёа 
fregiiência total, a situação pode ser descrita por meio da Tábua 7-23. Então, por defini- 


ção, 
à уз PE nO eia 
x = np Е nq 
MAP AP _ El . mP-p?P _ (MP? 
m fm = "РРР д) = »q С “С тут 


que é o quadrado da estatística 7 (5) da página 305. 


Tábua 7-23 


Freqüéncia Observada 


Frequência Esperada 


7.61. Suponha-se que Xi, Xs, ..., Хк têm distribuição multinomial com fre- 
qüéncias esperadas "pi, NP2, . . ., NPr respectivamente. Sejam Esse 3 
variáveis mutuamente independentes, com distribuição de Poisson com pará- 
metros А = Api Ае = рә, ..., Ак = рь respectivamente. Prove que 
a distribuição condicional dos Y dada por 


Yit Yao + = н 


é precisamente a distribuição multinomial dos X. 


Para a fungáo de probabilidade conjunta dos Y, temos 


Р " (Mp e7 (npp)"2e nm 
(1) P(Yi;— up Yo7 Um.» к=) = Е A IA) 


(ngo nm 
б [ y =] 


7.62. 


TESTES DE HIPÓTESES E SIGNIFICANCIA 355 


Mi ed ME. «spl 
| P Yk рург рр, 


уз! Yol Yr! 


-а 


onde usamos о fato que pı pa ccc + py = 1. А distribuição condicional que esta- 
mos procurando é dada por 


(2) P(Yi- у, Yo Va. Ye | Yit Yos + Ye — m) 
-+Y =n) 


P(Y, 


Quanto 20 denominador, sabemos do Probl. 4.95, pág. 208, que YitYot..tYy 
é também uma variável de Poisson com parámetro пр; + "рә 1 --- t npy = n. Lo- 
go, o denominador tem por valor 

mhe-n 


Assim, (2) fica 
PO = у, Ya s -.., Укук | Yit Yat +++ =н) 


эр... pl 
P: Pk 
vil vs! y rr fo 


que nada mais é que a distribuição multinomial dos X. (compare com (16), pág. 162). 


Use o resultado do Problema 7.61 para mostrar que X, tal como definido 
por (21) pág. 310, tem aproximadamente distribuigáo qui-quadrado. 


Tal como se apresenta, a expressão (21) é de difícil manejo porque os Xºs multi- 
nomialmente distribuídos são dependentes, em vista da restrição (22). Entretanto, o 
Problema 7.61 mostra que podemos substituir os X pelos Y independentes, distribuí- 
dos segundo Poisson, desde que Y + Yo ::: БҮК — n. Portanto, podemos reescre- 
ver (21) como E 


‚ [Za f Ya MMC RR 
а) же сө )* d ) 


Quando тп > =, todos os À. tendem para co, e o teorema do limite central para a dis- 
tribuição de Poisson ((14), pág. 161), dá 


(2) = MAH t 


onde os Z são variáveis normais independentes com média 0 e variância 1, cuja distri- 
buição é condicionada ao evento 


(3) M Zy + Vd Za + ob VALE = 0 
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ou Vp, + VPaZa + ++ + Vp = 0 
ou, como as variáveis aleatórias sao contínuas, 
(4) [У Z, + Ур Zo + +++ + Vp ZR) < е 


Denotemos por F,(w) a função de distribuição cumulativa para uma variável qui- 
quadrado com » graus de liberdade. Então, o que queremos provar é: 


6) Р(2 +28: у Zi VD Za do + VB Zil < ©) 
Р@+#+- + e | VPZ t VPZ +t Ут 9) 
Р(| р Z1 + УР» Zat e + Vp Zel < ©) 


E 1 


para um valor conveniente de v. 

É fácil estabelecer (5) usando a intuição geométrica. Primeiro de tudo, o Teorema 
4-3 mostra que a distribuição não-condicional de Zi + 7+ + ZÈ é qui-quadrado 
com Kk graus de liberdade. Logo, como a função de densidade para cada Zjé 
(Em) Уе, 


à Fila) = (o) rar A da des: e dz, 
Além disso, temos para o numerador de (5): 
(т) Numerador =  (2;)- 9 e- Gibt UP йш, dese day 


| VERTES рар «e 
Recordemos, da geometria analítica, que, no espaço tri-dimensional, хі +25 + 
+x3 <a? representa o sólido esférico de raio а e centro na origem enquanto que Qux, + 
+ арх + 03x3 =0 é um plano pela origem, cuja normal é o vetor (0, 05, 03). A Fig 
7-16 mostra a intersceção dos dois corpos. É óbvio que, quando uma função que depen- 
de somente da distância à origem, isto é, 


D 


Hr) onde r = Vzitzibtzi 


é integrada sobre a área circular — ou parte dela — o valor da integral é completamente 
independente dos cossenos diretores «1,2% Em outras palavras, todos os planos 
que passam pela origem determinam a mesma integral. 

Por analogia, concluímos que, em (7), onde «77/2. é integrada sobre a intersec- 
ção de uma hiperesfera centrada na origem e um hiperplano passando pela origem, pode- 
se atribuir aos p quaisquer valores convenientes. olhemos 

pi > Py es = Bear P © 1 


е obtemos 


TESTES DE HIPÓTESES E SIGNIFICÂNCIA 357 


(8) Numerador = (27) *2 Í - jf Ce ta de dzo dz, (20 


= (29) VF, ,(2)29) 


La 


Y 


PÁ 


Y 


Fig. 7-16 


usando (6). O fator 2e ёа espessura. 
Para calcular o denominador em (5), notemos que a variável aleatória 


W = үр, 2, + Vas +++ + PRI 


é normal (porque é uma combinação lincar dos Z independentes, normais) e que 


E(W) = Ут! (0) + Ут (0) + eee + Ур (0) = 0 
Var(W) = pi(D + pal) + => + pll) = 1 


1l 


Assim a função de densidade para Wé p(w) = (27) 12e-mêz, e 
(9) Denominador = P(W|«e) = o(0)2e = (2v) 1226) 


Dividindo (8) por (9), obtemos o resultado desejado, onde ғ = k — 1. 


A “demonstração” acima (que pode ser dada rigorosamente) mostra incidental- 
mente que todo vínculo linear imposto aos Z е, daí, aos X ou aos Y — reduz 
de 1 o número de graus de liberdade em x. Isto justifica a base para as regras dadas 
na página 311. 
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Problemas Suplementares 


TESTES DE MÉDIAS E PROPORÇÕES 
POR MEIO DA DISTRIBUIÇÃO NORMAL 


7.63. 


7.64. 


7.65. 


7.66. 


7,67. 


7.68. 


7.69, 


7.70. 


733: 


Uma urna contém bolas que são vermelhas ou azuis. Para testar a hipótese de iguais 
proporções dessas cores, extraem-se, sem reposição, 64 dessas bolas, registrando a cor 
observada, e adota-se a seguinte regra de decisão: (1) aceitar a hipótese no caso de o 
número de bolas vermelhas extraídas estar entre 28 e 36; (2) rejeitar a hipótese em caso 
contrário. (a) Determine a probabilidade de rejeitar a hipótese quando ela é realmente 
correta. (b) Interprete graficamente a regra de decisão e o resultado obtido em (a). 


(a) Que regra de decisão adotaria no Problema 7.63 no caso de a probabilidade de 
rejeição da hipótese — sendo ela correta — ser no máximo de 0,01 (i.c., no caso de se 
desejar um nível de significância de 0,01)? (b) Em que nível de confiança aceitaria a 
hipótese? (c) Qual seria a regra de decisão no caso de se adotar um nível de significação 
de 0,05? 


Suponhamos que, no Problema 7.63, quiséssemos testar a hipótese de que há maior 
proporção de bolas vermelhas do que de azuis. (a) Qual seria a hipótese nula, e qual 
seria a hipótese alternativa? (b) Usaríamos um teste unilateral ou bilateral? Por quê? 
(c) Que regra de decisão adotaria ao nível de significância de 0,05? (d) Qual a regra de 
decisão no caso do nível de significância de 0,01? 


Joga-se 100 vezes um par de dados, observando-se 23 vezes a ocorrência de “sete”. 
Teste a hipótese de que os dados são honestos, utilizando (2) um teste bilateral, (b) um 
teste unilateral, ambos ao nível de significância de 0,05. Justifique sua preferência para 
um ou outro desses testes, se for o caso. 


Faça o Problema 7.66 ao nível de significância de 0,01. 


Um fornecedor alega que, pelo menos 95% do equipamento por ele fornecido a uma 
fábrica estão de acordo com as especificações. Uma amostra de 200 peças do equipamen- 
to acusou 18 defeituosas. Teste a justificativa do fornecedor ao nível de (a) 0,01, 
(b) 0,05. 


A experiência demonstrou que a resistência média de determinado tipo de fio é de 
9,72 onças, com desvio padrão de 1,40 onças. Uma amostra recente de 36 peças do fio 
acusou uma resistência média de 8,93 onças. Ao nível (a) de 0,05, (b) de 0,01, pode-se 
concluir que a qualidade do fio decresceu? 


Em um exame aplicado aos alunos de um número muito grande de escolas, a nota média 
foi 74,5 e o desvio padrão 8,0. Em determinada escola com 200 estudantes submetidos 
ao exame, a nota média foi 75,9. Discuta a significância deste resultado ao nível de 0,05, 
do ponto de vista (4) de um teste unilateral, (b) de um teste bilateral, explicando 
cuidadosamente suas conclusões com base em tais testes. 


Faça o Problema 7.70 ао nível de significância de 0,01. 
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TESTES QUE ENVOLVEM DIFERENÇAS DE MÉDIAS E DE PROPORÇÕES 


7.72. 


7.73. 


7.75, 


7.76. 


Uma amostra de 100 lâmpadas elétricas produzidas pela fábrica A acusa vida média 
de 1.190 horas e desvio padrão de 90 horas. Uma amostra de 75 lâmpadas fabricadas pela 
indústria B acusa vida média de 1.230 horas com desvio padrão de 120 horas. Há dife- 
renga entre as vidas médias das duas marcas ao nível de significância de (a) 0,05, 
(5) 0,01? 


No Problema 7.72, teste a hipótese de que as lámpadas da fábrica B sejam superiores às 
da fábrica A, utilizando um nível de (a) 0,05, (5) 0,01. Explique a diferença entre isto 
€ o que foi pedido no Problema 7.72. Os resultados aqui obtidos contradizem os do 
Problema 7.72? 


. Num exame de leitura em uma escola elementar, a nota média de 32 meninos foi 72, 


com desvio padrão de 8, e a nota média de 36 meninas foi 75, com desvio padrão de 6. 
Teste a hipótese de que as meninas acusam melhor rendimento na leitura, do que os 
meninos, ao nível de significância de (a) 0,05, (b) 0,01. 


A fim de testar os efeitos de um novo fertilizante sobre a produção de trigo, dividiu-se 
um lote de terra em 60 quadrados de mesma área, todos eles com as mesmas propric- 
dades quanto à qualidade do solo, exposição aos raios solares, etc. Aplicou-se o novo 
fertilizante em 30 quadrados, e o antigo fertilizante aos outros 30. A colheita média 
nos lotes tratados pelo novo fertilizante foi de 18,2 “bushels”, com desvio padrão de 
0,63 “bushels”. Os valores correspondentes nos demais lotes (antigo fertilizante) foram 
17,8 e 0,54, respectivamente. Ao nível de significância (a) de 0,05, (b) 0,01, teste a 
hipótese de que o novo fertilizante é melhor do que o antigo. 


Amostras aleatórias de 200 porcas fabricadas pela máquina 4 e 100 porcas fabricadas 
pela máquina B acusam 19 e 5 defeituosas, respectivamente, Teste a hipótese de que 
(a) as duas máquinas acusam graus diferentes de eficiência, e (b) a máquina B é mais 
eficiente do que a máquina A. Use o nível de significância de 0,05. 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO г DE STUDENT 


элт. 


7.78. 


7.79. 


A vida média das lâmpadas elétricas fabricadas por determinada companhia, no passado, 
tem sido de 1.120 horas, com desvio padrão de 125 horas. Uma amostra de 8 lâmpadas 
extraída de um lote fabricado recentemente acusou vida média de 1.070 horas. Teste a 
hipótese de que a vida média das lâmpadas não se modificou, ao nível de significância 
de (a) 0,05, (b) 0,01. 


No Problema 7.77, teste a hipótese И = 1.120 horas contra a hipótese alternativa 
HM < 1.120 horas, utilizando um nível de significância (a) de 0,05, (b) de 0,01. 


As especificações de produção de determinada liga exigem 23,2% de cobre. Uma amostra 
de 10 análises da liga acusou conteúdo médio de cobre de 23,57%, com desvio padrão de 
0,24% Pode-se concluir que o produto satisfaz às especificações, ao nível de (a) 0,01 
e (b) 0,05? 
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7.80. 


7,81. 


7.82. 


7.83. 


No Problema 7.79, teste a hipótese de que o conteúdo médio de cobre é superior ao 
exigido pelas especificações, utilizando um nível de significância (а) de 0,01, (b) de 
0,05. 


Um técnico em eficióncia alega que a introdugáo de um novo tipo de máquina em 
determinado processo de produção pode reduzir substancialmente o tempo necessário 
para а produção. Levando em conta a despesa com а manutenção das máquinas, a 
direção da empresa acha que, a menos que o tempo de produção possa ser reduzido de 
8,0%, pelo menos, a empresa não pode arcar com a introdução do novo processo. Seis 
experimentos acusam um decréscimo médio de 8,4% no tempo de produção, com desvio 
padrão de 0,32% Utilizando um nível de significância (a) de 0,01 e (b) de 0,05, teste 
a hipótese de que o novo processo deve ser adotado, 


Testaram-se dois tipos, A e B, de solução química em relação ao pH (grau de acidez da 
solução). A análise de 6 amostras da solução 4 acusou pH médio de 7,52 com desvio 
padrão de 0,024, enquanto que à análise de 5 amostras da solução B acusou pH médio 
de 7,49 com desvio padrão de 0,032. Ao nível de significância de 0,05, teste a hipótese 
de que os dois tipos de solução têm pH diferente. 


Em um exame de psicologia, 12 estudantes de uma classe tiveram nota média de 78, 
com desvio padrão de 6, enquanto que 15 estudantes de outra classe tiveram nota média 
de 74 com desvio padrão de 8. Ao nível de significância de 0,05, determine se o primeiro 
grupo é superior ao segundo. 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO QUI-QUADRADO 


7.84. 


7.85, 


7.86. 


O desvio padráo das resisténcias de determinados cabos fabricados por uma companhia é 
dado como 240 lbs. Após introdução de uma modificação no processo de fabricação de 
tais cabos, a resistência de uma amostra de 8 cabos acusou desvio padrão de 300 lbs. 
Investigue a significáncia do aumento aparente de variabilidade, utilizando no nível de 
significância de (a) 0,05, (b) 0,01. 


Obtém-se a temperatura anual de uma cidade determinando-se a média das temperaturas 
médias no 159 dia de cada mês. O desvio padrão das temperaturas anuais da cidade, em 
um período de 100 anos, é 16º F. Durante os últimos 15 anos, o desvio padrão calculado 
foi de 10º Е. Teste a hipótese de que as temperaturas na cidade se tornaram menos 
variáveis do que no passado, utilizando um nível de significância (a) de 0,05, (b) de 0,01. 


No Problema 7.77, uma amostra de 20 lâmpadas elétricas acusou desvio padrão de 150 
horas na vida média. Poderíamos concluir que tal resultado é fora do usual? Explique. 


TESTES QUE ENVOLVEM A DISTRIBUIÇÃO F 


787. 


7.88. 


= 16e 


Duas amostras consistindo de 21 e 9 observações, têm variáncias dadas por sj 
= = 8 respectivamente. Ao nível de significância de (a) 0,05, (b) 0,01, teste a hipótese 
de que a variância da primeira população é maior do que a da segunda. 


Faça o Problema 7.87 no caso de as duas amostras consistirem de 60 e 120 observações, 
respectivamente. 


7.89, 
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Ao nível de significância de 0,10, podemos concluir, no Problema 7.82, que haja diferen- 
ça significativa na variabilidade do pH das duas soluções? 


CURVAS CARACTERISTICAS DE OPERAÇÃO 


7.90. 


7.91. 


7.92. 


7,93, 


Com referéncia ao Problema 7.63, determine a probabilidade de aceitar a hipótese de 
iguais proporções de bolas vermelhas e azuis quando a proporção efetiva p de vermelhas 
é (a) 0,6, (b) 0,7, (с) 0,8, (d) 0,9, (e) 0,3. 


Represente os resultados do Problema 7.90 construindo um gráfico de 

(а) £ vs. p, (b) (1— В) vs. p. 

Compare estes gráficos com os do Problema 7.25 considerando a analogia de bolas 
vermelhas e azuis com caras e coroas, respectivamente. 


(a) Faga os Problemas 7.26 e 7.27 no caso de se testarem 400 cordas. (b) Que conclusóes 
podemos tirar quanto aos riscos de erro tipo П quando se aumenta o tamanho da 
amostra? 


Construa (a) uma curva CO e (b) uma curva de poder para o Problema 7.65. Compare 
€ssas curvas com as do Problema 7.27. 


CARTAS DE CONTROLE DE QUALIDADE 


7.94. 


7.95. 


No passado, certo tipo de fio de um fabricante acusou resistência média de 8,64 oz., com 
desvio padráo de 1,28 oz. A fim de determinar se o produto está de acordo com as 
especificações, toma-se uma amostra de 16 pedaços de fio cada 3 horas, calculando-se a 
resistência média. Determine limites de controle de (a) 99,73% ou 30, (b) 99%е (c) 95% 
para uma carta de controle de qualidade e explique suas aplicações. 


Em média, 3% das porcas fabricadas por determinada Companhia são defeituosas. A fim 
de manter tal nível, extrai-se e examina-se uma amostra de 200 porcas produzidas cada 
quatro horas. Determine limites de controle de (2) 99% e (b) 95% para o número de 
porcas defeituosas em cada amostra. Observe que, no presente caso, necessitamos apenas 
dos limites superiores de controle. 


AJUSTAMENTO DE DADOS POR DISTRIBUIÇÕES TEÓRICAS 


7.96. 


Ajuste uma distribuição binomial aos dados da Tábua 7-24. 


Tábua 7.24 


2 


46 


ha 
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7.97. Use o papel de probabilidade para determinar se os dados do Problema 5.98 podem ser 
convenientemente aproximados por uma distribuição normal. 


7.98, Ajuste uma distribuição normal aos dados do Problema 5.98. 
7.99. Ajuste uma distribuição normal aos dados do Problema 5.100. 


7.100. Ajuste uma distribuição de Poisson aos dados do Problema 7.96 e compare com o 
correspondente ajustamento binomial. 


7.101. A Tábua 7-25 dá o número de mortes resultantes de coice de cavalos ocorridas, em um 
período de 20 anos (1875-1894) em 10 unidades do exército prussiano. Os números 
referem-se a mortes por unidades por ano. Ajuste uma distribuição de Poisson a esses 
dados. 


Tábua 7-25 


O TESTE QUI-QUADRADO 


7.102. Em 60 jogadas de uma moeda, observaram-se 37 caras e 23 coroas. Teste a hipótese de 
que a moeda é honesta, utilizando um nível de significância de (a) 0,05 (b) 0,01. 


7.103. Faça o Problema 7.102 aplicando a correção de Yates. 


7.104. Durante um longo período, as classificações atribuídas por um grupo de professores em 
um curso acusaram 12% A, 18% B, 40% C, 18% D e 12% F. Um novo professor 
conferiu 22 A, 34 B, 66 C, 16 De 12 F. Ao nível de significância de 0,05, deter- 
mine se o novo professor está mantendo os padrões estabelecidos por seus antecessores. 


7.105. Jogam-se três moedas 240 vezes, anotando-se o número de caras cada vez. A Tábua 7-26 
dá os resultados observados e os resultados esperados, na hipótese de as moedas serem 
honestas. Teste esta hipótese ao nível de significância de 0,05. 


Tábua 7-26 


Fregiiência 
Observada 


Freqüéncia 
Esperada 


7.106. A Tábua 7-27 dá os números de livros emprestados por uma biblioteca pública em de- 
terminada semana. Teste a hipótese de que o número de livros emprestados não depende 
do dia da semana, utilizando um nível de significância de (a) 0,05, e (b) de 0,01. 
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Tábua 7-27 


Número de livros 
emprestados 


7.107. Uma urna contém 6 fichas vermelhas e 3 brancas. Extraem-se aleatoriamente duas fichas 
da urna, anotando-se suas cores e repondo-se as fichas na urna. Repete-se o processo 
120 vezes, com os resultados constantes da Tábua 7-28. (a) Determine as freqü&ncias 
esperadas. (b) Ao nível de significância de 0,05, determine se os resultados observados 
concordam com os resultados esperados. 


Tábua 7-28 


1 vermelha | 2 vermelhas 
1 branca O branca 


7.108. Selecionam-se ao acaso 200 porcas da produção de cada uma de 4 máquinas, constatan- 
dose 2, 9, 10 e 3 defeituosas, respectivamente. Ao nível de significância de 0,05, deter- 
mine se há diferença significativa entre a eficiência das máquinas. 


O vermelha 
2 brancas 


ADERÊNCIA 


7.109. (a) Usc o teste qui-quadrado para determinar a aderência do ajustamento dos dados do 


Problema 7.96. (b) O ajustamento é “demasiadamente bom”? Use um nível de 0,05. 


7.110. Use o teste qui-quadrado para determinar a aderência dos dados (a) do Problema 7.98, 
(b) do Problema 7.99. Use um nível de significância de 0,05 e em cada caso determine 
se o ajustamento é “demasiadamente bom”. 


7.111. Use o teste qui-quadrado para determinar a aderência do ajustamento aos dados (a) do 
Problema 7.100, (b) do Problema 7.101. Seu resultado em (a) é consistente com o do 
Problema 7.109? 


TABELAS DE CONTINGÊNCIA 


7.112. A Tábua 7-29 apresenta os resultados de um experimento destinado а investigar o 
efeito da vacinação de animais de laboratório contra determinada doença, Utilizando um 
nível de significância (a) de 0,01 e (b) de 0,05, teste a hipótese de que não há diferença 
entre os grupos vacinado e não-vacinado, ou seja, de que a vacina e a doença são inde- 
pendentes. 
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Tábua 7-29 


Não contraíram 
a doença 


Contraíram 
a doença 


Vacinados 


Não vacinados 


7.113. Faça o Problema 7.112 aplicando a correção de Yates. 


7.114.A Tábua 7-30 dá os números de estudantes em cada uma das duas classes À e B, que 
passaram e foram reprovados em um exame aplicado a ambas. Utilizando um nível de 
significância (a) de 0,05 e (b) de 0,01, teste a hipótese de que não há diferença entre as 
duas classes. Faça o Problema com a correção de Yates e sem ela. 


Tábua 7-30 


Aprovados | Reprovados 


Classe А 


Classe B. 


7.115. Em um grupo de pacientes que se queixavam de insônia, ministrou-se a uns um soporí- 
fero, e a outros pílulas de agúcar (muito embora estes últimos estivessem certos de que 
estavam tomando pílulas soporíferas). Perguntados posteriormente sobre os efeitos, 
deram as respostas constantes da Tábua 7-31. Admitindo que todos tenham dito a 
verdade, teste a hipótese de que não há diferença entre os efeitos das pílulas soporíferas 
e os das pílulas de açúcar, ao nível de significância de 0,05. 


Tábua 7-31 


Não dormiram 


Tomaram pílulas 
soporíferas 


Tomaram pílulas 
de acücar 
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Tábua 7-32 


A Favor Contra Indecisos 


85 


Democratas 


Republicanos 118 


7.116, Em determinado projeto de importância nacional, Democratas e Republicanos votaram 
conforme resultados constantes da Tábua 7-32. Ao nível de significância de (a) 0,01 e 
(b) 0,05, teste a hipótese de que não há diferença entre os dois partidos, no que diz 
respeito ao projeto em questão. 


7.117. A Tábua 7-33 exibe os resultados obtidos por estudantes em matemática c física. Teste 


a hipótese de que os resultados em física são independentes dos resultados em matemáti- 
ca, ao nível de significância (a) de 0,05, (b) de 0,01. 


Tábua 7-33 


MATEMÁTICA 


Notas Notas Notas 
` Altas Médias Baixas 


Notas altas 56 


Notas médias 47 


FISICA 


Notas baixas 14 


7.118, A Tábua 7-34 dá os resultados de uma pesquisa destinada a determinar se a idade do 
motorista de 21 anos ou mais tem influéncia no número de acidentes em que o mesmo 
se envolve (inclusive acidentes de menor importáncia). Ao nível de significância (а) de 
0,05, (b) de 0,01 teste a hipótese de que o número de acidentes é independente da idade 
do motorista. Que fontes possíveis de dificuldade nas técnicas de amostragem, ou que 
outras considerações poderiam afetar seus resultados? 


Tábua 7-34 


IDADE DO MOTORISTA 


21-30 | 31-40 | 41-50 [ 51-60 
"m 0 748 821 186 
a 
9 1 74 60 5] 66 50 
dE 2 ] 31 25 22 16 15 | 
2 | Mais de 2 9 10 6 5 7 
| 


h 
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7.119. (а) Prove que x? = 3 (x;/np;) — ^" para todas as tabelas de contingência, onde п é a 
freqüéncia total de todas as células. (b) Utilizando o resultado de (4) faça o Problema 
FIM 


7.120.Sc nj e nj denotam respectivamente a soma das fregiiências па 1а tinha e па Ја coluna de 
uma tabela de contingência (freqüéncias marginais), mostre que а freqüéncia esperada 
para a célula pertencente à іа linha e ја coluna é n;n;/n, onde n é a fregiiência total de 
todas as células. 


7.121. Prove o resultado (2) do Problema 7.49. 

7.122. Por analogia com as idéias desenvolvidas para uma tabela de contingência h x k, discuta 
as tabelas de contingência h X k X 1, indicando possíveis aplicações das mesmas, 

COEFICIENTE DE CONTINGÊNCIA 

7.123. A Tábua 7-35 exibe a relação entre cor de cabelo e cor dos olhos em um grupo de 200 


mulheres. (4) Determine o coeficiente de contingência sem a correção de Yates e com 
ela. (b) Compare o resultado de (a) com o coeficiente máximo de contingência. 


Tábua 7-35 


COR DO CABELO 


Não louro 
a 
Za Azul 
SEE 
B | Nño azul 


7.324. Determine o coeficiente de contingência para os dados (a) do Probl. 7.112 e (b) do 
Probl. 7.114, sem a correção de Yates e com ela. 


7.125. Determine o coeficiente de contingência para os dados do Problema 7.117, 


7.126. Prove que o coeficiente máximo de contingéncia para uma tabela 3 X 3 é dada aproxima- 
damente por vê = 0,8165. 


7.127. Prove que o coeficiente máximo de contingência para uma tabela ЕХ & é Vk — 107. 


PROBLEMAS DIVERSOS 


7.128. Duas urnas A e B contêm número igual de bolas, mas as proporções das duas cores, 
vermelhas e brancas, são desconhecidas. Ex trai-se de cada uma uma amostra de 50 bolas, 
com reposição, constando-se 32 vermelhas da uma 4 e 23 vermelhas da uma B. Ao 
nível de significância de 0,05, teste a hipótese de que (a) as duas urnas contêm iguais 
proporções de bolas vermelhas e (b) 4 contém maior proporção de vermelhas do que B. 
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7.129, Para o Problema 7.54, determine o número mínimo de questões que o estudante deve 
responder corretamente para que, 20 nível de significância de (a) 0,05, (b) 0,01, 
(c) 0,001 e (d) 0,06, o instrutor possa certificar-se de que o estudante não está simples- 
mente “adivinhando”, Discuta os resultados. 


7.130. Construa, para o Problema 7.55, gráficos análogos aos do Problema 7.23. 


7.131. Faça os Problemas 7.54—7.56 se о 7 da regra da decisão do Probl. 7-54 é substituído 
por 8. 


7.132, Em 8 jogadas de uma moeda aparece cara 7 vezes. Pode-se rejeitar a hipótese de que a 
moeda é honesta, ao nível de significância (a) de 0,05, (b) de 0,1, (c) de 0,01? Use um 
teste bilateral. 


7.133, Faça o Problema 7.132 com um teste unilateral. 
7.134. Faça o Problema 7.132 no caso de aparecerem 6 caras em 8 jogadas. 


7.135, Discuta como se pode usar a teoria da amostragem para investigar as proporções de 
diferentes tipos de peixe em um lago. 


7.136. Explique como definiria intervalo de confiança unilateral e indique uma aplicação 
possível. 


7.137. A percentagem de graus A atribuídos no curso de física de uma universidade, durante um 
longo período de tempo, é 10%. Em determinado período letivo houve 404 em um 
grupo de 300 estudantes. Teste a significância deste resultado ao nível de (a) 0,05, 
(b) 0,01. 


7.138. Com gasolina marca 4, o número médio de milhas por galão percorridas por 5 automó- 
veis análogos, em idênticas condições, foi de 22.6, com desvio padrão de 0,48. Com a 
gasolina marca B, a média foi de 21,4, com desvio padrão de 0,54. Ao nível de signifi- 
cância de 0,05, investigue se a marca 4 é realmente melhor do que a marca B, no sentido 
de qué proporciona maior percurso por galão. 


7.139.No Probl 7.138, há maior variabilidade no número de milhas por galão no caso da 
gasolina A? Explique, 


7.140. Para a Tábua 7-36, prove que 
"M A. 2 2 2 
a а az b b (7 
в = аа 8 S (S za Ja 


x +2)+ 
E E TA 


Tábua 7-36 


E 
| 
Ё 
E 
E 


t 


"= 
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7.141. Generalize o resultado do Problema 7.140. 


7.142. Use o resultado do Problema 7.140 para obter o valor de x para o Probl. 7.47. 


capítulo 8 


Ajustamento, Regressão e Correlação 


AJUSTAMENTO DE CURVAS 


Na prática, constata-se frequentemente a existência de uma relação entre 
duas (ou mais) variáveis e se deseja expressar tal relação sob forma matemática, 
estabelecendo-se uma equação entre as variáveis. 

Primeiro passo para isso é a coleta de dados exibindo os valores correspon- 
dentes das variáveis. Por exemplo, sejam x e y, respectivamente, a altura e o pe- 
so de adultos do sexo masculino. Uma amostra de n indivíduos acusaria alturas 
X4, X2, e Хр € OS correspondentes pesos Yi, Yz, -r Yn- 

Segundo passo: Gráfico dos pontos (xi, уз), (Xo, Ya) -~ Œm Yn) em um 
sistema de coordenadas retangulares. O conjunto resultante costuma chamar-se 
diagrama de dispersão. 

Pelo diagrama de dispersão, muitas vezes se pode visualizar uma curva aproxi- 
mativa dos dados. Tal curva é chamada curva aproximadora. Na Fig. 8-1, p.ex., os 
dados parecem bem aproximados por uma linha reta; dizemos então que há uma 
relação linear entre as variáveis. Já na Fig. 8-2, conquanto exista um relacionamento 
entre as variáveis, tal relacionamento não é linear; diz-se então que há uma relação 
não-linear entre as variáveis. Finalmente, a Fig. 8-3 não sugere nenhum tipo de 
relação entre as variáveis. 


alo da pp a ш _ 


370 PROBABILIDADE E ESTATÍSTICA 


Fig. 8-1 Fig. 8-2 


Fig. 8-3 


O problema de determinar equações de curvas que se ajustem a determinados 
conjuntos de dados observados é chamado ajustamento de curvas, ou simplesmente 
ajustamento. Na prática, frequentemente o próprio diagrama de dispersão sugere O 
tipo de curva a ser adotado. Assim, para à Fig. 8-1, poderíamos usar uma linha reta 


y = a+bx (1) 
enquanto que, para a Fig. 8-2, tentaríamos uma parábola, ou curva quadrática, 
y = ad 02 + са? (2 


Аз vezes é útil construir o diagrama de dispersão em termos de variáveis transforma- 
das. Assim, p.ex., se log y vs. x conduz a uma linha reta, experimentaríamos 

logy = a + bx 
como equação da curva aproximadora. 


REGRESSÃO 


Um dos principais objetivos do ajustamento é estimar uma das variáveis (a 
variável dependente) em função da outra (variável independente). Tal processo de 
estimação costuma designar-se regressão. Se y deve ser estimado em função de x por 
meio de uma equação, tal equação é denominada equação de regressão de y sobre x 
e a curva correspondente é a curva de regressão de y sobrex. ` 
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O MÉTODO DOS MÍNIMOS QUADRADOS 


De modo geral, pode-se ajustar mais de uma curva a determinado conjunto de 
dados. A fim de evitar critérios individuais na escolha de rotas, parábolas, etc., é 
necessário chegar-se а um acordo quanto ao que se deve entender por “melhor 
reta”, “melhor parábola”, etc. 

A fim de motivar uma possível definição, consideremos a Fig. 8-4, em que os 
pontos dados são (21, yi), . . . , (v, ys). 


Para determinado valor de x, digamos X,, haverá uma diferenga entre o valor 3i 
e o correspondente valor “ajustado”, determinado pela Curva C. Denotamos tal 
diferença por d, , e chamamo-la desvio, erro ou resíduo; seu valor pode ser positivo, 
negativo ou zero. Analogamente, para os valores 22, ..., 1, obtemos os desvios 
do, ..., Om. 


(En Un) 


(xo, yo) 


Fig. 8-4 


Uma medida da “aderência”, ou- “validade do ajustamento”, da curva C 
aos dados do problema é dada pela quantidade d; + d + +: + dB. Se esta quan- 
tidade é pequena, o ajustamento é bom; se é grande, o ajustamento é mau. Formu- 
lamos, então, a 


Definição: De todas as curvas que se aproximam de determinado conjunto de 
pontos, a curva que goza da propriedade 
di+do+--- + di = mínimo 
é a melhor curva ajustadora. 
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Uma curva com esta proptiedade se ajusta aos dados no sentido dos mínimos 
quadrados, e é chamada curva de regressão de mínimos quadrados, ou simplesmen- 
te curva de mínimos quadrados. Temos então reta de mínimo quadrados, parábola 
de mínimos quadrados, etc. 

É usual empregar a definição acima quando x é a variável independente e y 
é a variável dependente. Se x é a variável dependente, modifica-se a definição, 
considerando-se desvios horizontais ao invés de verticais — o que equivale a per- 
mutar os eixos x e y. Essas duas definições conduzem em geral a duas curvas de 
mínimos quadrados diferentes. A menos que se especifique o contrário, considera- 
remos x como variável independente e y como variável dependente. 

Outra possibilidade consiste em considerar distâncias perpendiculares dos 
pontos observados à curva, em lugar de distâncias horizontais ou verticais. Tal 
processo, entretanto, não é muito usado. 


A RETA DE MÍNIMOS QUADRADOS 
Pela definição acima, pode-se mostrar (v. Probl. 8.3) que a reta de mínimos 


quadrados que aproxima, ou ajusta, o conjunto de pontos (La, Ya), - - ++ (Ln, Yn) 
tem por equação 


y = a+bz (3) 
onde as constantes a e b são determinadas resolvendo-se o sistema 
Уу = тъъ Ў 4) 


Уру =аўуаш+Ь?2 7? 
chamado sistema de equações normais para a reta de mínimos quadrados. Note-se 


que, para abreviar, usamos 57 Y, bo xy em lugar de A Yi p 2301. 
As equações normais (4) podem ser facilmente memorizadas notando-se que, for- 
malmente, a primeira equação se obtém somando-se ambos os membros de (3), 
enquanto que a segunda equação se obtém multiplicando-se primeiro ambos os 
membros de (3) por x e somando-se em seguida. Obviamente, isto não é uma 
dedução das equações normais mas apenas um processo para memorizá-las. 

Os valores de a e b obtidos de (4) são dados por 


a = (CU) - Gee») р плу CS ? 

= use (Xy = Bay (5) 
O valor de b em (5) pode escrever-se também 

3 (e — Р 

b = — S m 


Aqui, como de costume, o trago superior indica média, isto é, = (Ха)/т. A divi- 


são de ambos os membros da primeira equação de (4) por и dá 
Y = «4 bi (7) 
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Assim, se quisermos, poderemos primeiro determinar b a partir de (5) ou (6) e 
então usar (7) para determinar а = 7 — bë. Isto equivale a escrever a reta de 
mínimos quadrados como 
у-й = Мш-% o yy = DD a (8) 
O resultado (8) mostra que a constante 5, que é o coeficiente angular da reta (3), é 
a constante fundamental para determinar a reta. De (8) vê-se também que a reta de 
mínimos quadrados passa pelo ponto (%, ў), chamado centróide, ou centro de 
gravidade dos dados. 

O coeficiente angular b da reta de regressão é independente da origem de 
coordenadas. Isto significa que, se fizermos a transformação (translação dos eixos) 
dada por 


=" +h v=y+k (9) 
onde A e k são constantes quaisquer, então b será também dado por 
n20y (20 (Ey) _ x(w— mA Y) 
b s a 7 = = (10) 
nig (Dat)? Iw — mp 
onde x, y foram substituídos рог x', у' (por este mótivo dizemos que b é invariante 
sob a transformação (9)). Note-se, todavia, que a — intercepto da reta sobre o eixo 
Ox — depende efetivamente da origem (e, assim, não é invariante). 
No caso particular em que h = 2, k = 7, (10) se simplifica para 
b = Уку mn d 
— Ex? 
Os resultados (10) ou (11) sáo úteis para simplificar o trabalho de cálculo na deter- 
minagáo da reta de mínimos quadrados. 

As observações acima valem também para a reta de regressão de x sobre y. 
Formalmente, os resultados se obtém simplesmente permutando x e y. Assim, por 
exemplo, a reta de mínimos quadrados de x sobre y é 
po Me-2 Di; 2 

= ap (y-3) (12) 
Note-se porém que, em geral, (12) náo é a mesma reta que (8). 


(11) 


A RETA DE MINIMOS QUADRADOS EM TERMOS 
DA VARIÂNCIA E COVARIÂNCIA AMOSTRAIS 


As variáncias e covariáncias amostrais de x e y sáo dadas por 
— pp — 312 Sy — Ma — 4 
5 E—3y e  X(y—5» y F(x — g)(y — 9) (13) 


Sr = к = y Sy = 
i n >” 4 n "d n 
Em função dessas expressões, as retas de regressão de mínimos quadrados de y 


sobre x e de x sobre y podem escrever-se respectivamente como 


y—4 = 89 (0—8) md = (yg) (14) 
5 Sy 


ыш 
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Se (v. (54), pág. 117) definirmos formalmente o coeficiente de correlação amos- 


tral por — ELE (15) 
8:8, 
então (14) pode escrever-se 
0—9 _ (2) g-i (29) (16) 
Sy Sz Sz Sy 


Em razão do fato de(z — &)/s+ e (y — )/sy serem valores amostrais padroniza- 
dos ou escores padronizados, os resultados de (16) proporcionam um modo muito 
simples de memorizar as retas de regressão. É claro que as duas retas em (16) são 
distintas, a menos que  — +1, quando então todos os pontos amostrais se encon- 
tram sobre uma reta (o que será mostrado em (26), havendo assim correlação e 
regressão linear perfeitas. 

É interessante notar também que, se as duas retas de regressão (16), se escre- 
vemcomo y=a+bx,e= c+dy respectivamente, entáo 

bg (17) 

Até agora não levamos em conta a significação precisa do coeficiente de correlação; 
definimo-lo apenas formalmente em termos das variâncias e da covariância. Essa 
significação será dada na página 376. 


A PARÁBOLA DE MINIMOS QUADRADOS 


As idéias acima podem ser estendidas facilmente. Por exemplo, a parábola de 
mínimos quadrados que se ajusta a um conjunto de dados é dada por 


y = a+ br + er? (18) 
onde a, b, c se determinam a partir das equações normais 
Ny = п +5 + еў e 
Уау = «Ус +05 са? (19) 


Уау = a+ dea 


E essas equações se obtêm formalmente somando-se ambos os membros de (18) 
após multiplicá-los por 1, por x e por x? respectivamente. 


REGRESSÃO MULTIPLA 


As idéias supra podem generalizar-se para mais variáveis. Por exemplo, se se 
nos afigura existir uma relação linear entre uma variável dependente z e duas variá- 
veis independentes x e y, então procuraremos uma equação entre essas variáveis 
com a forma 


2 = a+ba+ey (20) 
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Esta equação chama-se equação de regressão de z sobre x e y. Se x fosse a variável 
dependente, teríamos analogamente, uma equação de regressão de x sobre y e z. 

Pelo fato de a equação (20) representar um plano no sistema cartesiano 
retangular tri-dimensional, costuma dizer-se que ela representa um plano de regres- 
são. Para obter o plano de regressão de mínimos quadrados, determinamos a, b, c 
em (2) de modo que 


Ne = п +0 У + суу 
Se = eek Уа ed (21) 
Ew = «Уу + Уху + есуу 


Essas equações, chamadas equações normais correspondentes а (20), são obtidas 
aplicando-se definição análoga à da página 371. Note-se que, formalmente, elas 
são obtidas de (20) mediante multiplicação por 1, por x e por y, e subseqüente 
adição. 

Fazem-se facilmente generalizações para maior número de variáveis, envol- 
vendo equações lineares ou não-lineares que conduzem a superfícies de regressão 
em espaços de três ou-mais dimensões. 


ERRO PADRÃO DA ESTIMATIVA 


Seja yag O valor estimado de y, correspondente a determinado valor de x, 
e obtido da curva de regressão de y sobre x; então uma medida da dispersão em 
torno da curva de regressão é dada por 


2(0 — Уса)? 
Sus E (22) 


"n 


que se chama erro padrão da estimativa de y sobre x. Como X (y — Yes)? = Xd?, 
tal como utilizado na Definigáo da página 371, vemos que, de todas as possíveis cur- 
vas de regressáo, a curva de mínimos quadrados é a que apresenta menor erro pa- 
dr&o de estimativa. 

No caso de uma reta de regressão Yes. = a + bx, com a e b dados por (4), 
temos 


de = Ey — аху — Олу (23) 
n 
ou 
sio = HU" 0200 Wu) (24) 


n 
Podemos também exprimir sí. para a reta de mínimos quadrados em termos da 


variância e do coeficiente de correlação como 


sho = (1-9) (25) 
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donde, incidentalmente, decorre, como corolário, que 7? <1, іе. 1<1<1l. 

O erro padráo da estimativa goza de propriedades análogas ás do desvio 
padráo. Por exemplo, se construímos pares de retas paralelas à reta de regressão de 
y sobre x, às distâncias de Sys, 28у e 38yz respectivamente, encontramos, para 
n suficientemente grande, cerca de 68%, 95% e 99,7%, respectivamente, dos pontos 
amostrais compreendidos entre esses pares de retas. V. Problema 8.23. 


Assim como existe um estimador não-tendencioso da variância amostral, dado 
por 3° = ns?/(n — 1) existe também um estimador não-tendencioso do quadrado 
do erro padrão da estimativa. Este estimador é dado por Si, = nsi. (п — 2). Por 
esta razão, alguns estatísticos preferem tomar (22) com n — 2 em lugar de n no 
denominador. 

As observações acima modificam-se facilmente para a reta de regressão de x 
sobre y (quando então o erro padrão da estimativa se denota por S+») оо para 
regressão não-linear ou múltipla. 


O COEFICIENTE DE CORRELAÇÃO LINEAR 
Até agora definimos formalmente o coeficiente de correlação mediante (15), 


mas não examinamos sua significação. Para tal, notemos que, de (25) e das defini- 
ções de sy y e sy temos 


Z(y — y 
Hn 20/71 ba 
, 1- 507 Sam 
Podemos agora mostrar que (v. Problema 8.24) 

Duo = Ely y) + Esa (27) 


A quantidade à esquerda de (27) é chamada variação total. O primeiro somatório 
à direita de (27) é a variação não-explicada, e o segundo somatório é a variação 
explicada. Esta terminologia decorre do fato de que os desvios jj — Yes: Se compor- 
tam de maneira aleatória ou imprevisível, enquanto que os desvios сч — 7 são 
explicados pela reta de regressão de mínimos quadrados e tendem, assim, a seguir 
um padrão definido. Decorre de (26) e (27) que 


variação explicada 
variação total 


Assim, 72 pode ser interpretado como a fração da variação total que é explicada 
pela reta de regressão de mínimos quadrados. Em outras palavras, 7 mede quão 
bem a reta de regressão de mínimos quadrados se ajusta aos dados amostrais. Se a 
variação total é toda ela explicada pela reta de regressão, isto é, se 12 = 1 ou 
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r= +1, dizemos que há correlação linear perfeita (e, então, também regressão 
linear perfeita). Por outro lado, se a variação explicada é zero, isto é, se a variação 
total é toda ela não-explicada, » = 0. Na prática, a quantidade г?, por vezes denomi- 
nada coeficiente de determinação, situa-se entre Del. 

O coeficiente de correlação pode ser calculado a partir de um dos dois resulta- 
dos 


NE UP 5(0—2)(0— 9) — (29) 
Bug Ev 5(у — y 
pu А _ variação explicada _ 2 (уен y (зо) 
j variação total 2 (y — y) | 


os quais, para regressão linear, são equivalentes. A fórmula (29) costuma chamar-se 
fórmula do momento-produto para correlação linear. 


Outras fórmulas equivalentes às acima, também usadas na prática, são 


_ Co (31) 
Ма — (Xay]| ny? — (Ху)? 


Utilizando a transformação (9), página 373, obtemos 
EE Iry’ — (Eau) 
Vna? — (Za^]| ny"? — (Guy 


p= (33) 


о que mostra que ^ é invariante por translação de eixos. Em particular se й = X, 
k =y, (33) se escreve 


(34) 


fórmula que costuma ser útil nos cálculos. 

O coeficiente de correlação linear pode ser positivo ou negativo. Se r é posi- 
tivo y tende a aumentar com x (o coeficiente angular da reta de mínimos quadrados 
é positivo) enquanto que se r é negativo, y tende a decrescer quando x cresce 
(o coeficiente angular da reta é negativo). O sinal é automaticamente levado em 
conta se usamos o resultado (29), (31), (32), (33) ou (34). Todavia, ao utilizarmos 
(30) para obter r, devemos aplicar o sinal conveniente. 
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COEFICIENTE DE CORRELAÇÃO GENERALIZADO 


A definição (29) (ou qualquer de suas formas equivalentes (31) a (34)) do 
coeficiente de correlação envolve somente valores amostrais x, y. Conseqüente- 
mente, dá o mesmo nümero para todas as formas de curvas de regressáo e é inope- 
rante como medida de aderéncia de ajustamento, exceto no caso da regressão linear, 
quando coincide com (30). Todavia, a última definição, isto é 

variação explicada B (Yes — Y)? (85) 


8 = ES des E 
1 = variado total Sy yy 


reflete efetivamente а forma da curva de regressão (através de Wes) e é, assim, 
adequada como definição de um coeficiente de correlação generalizado r. Utiliza- 
mos (35) para obter coeficientes de correlação não-linear (que medem quão bem 
uma curva de regressão não-linear se ajusta aos dados) ou, mediante generalização 
apropriada, coeficientes de correlação múltipla. A relação (25) entre o coeficiente 
de correlação e o erro padrão da estimativa vale também para correlação não-linear. 

Como um coeficiente de correlação mede simplesmente quão bem determina- 
da curva de regressão (ou superfície) se ajusta aos dados amostrais, não tem sentido 
utilizarmos um coeficiente de correlação linear quando os dados não são lineares. 
Suponha-se, todavia, que apliquemos (29) a dados não lineares e obtenhamos um 
valor numérico consideravelmente inferior a 1. Então a conclusão a ser tirada não é 
que exista pequena correlação (conclusão a que, por vezes, chegam pessoas não 
familiarizadas com a teoria da correlação), e sim que existe pequena correlação 
linear. Na verdade, pode haver até uma grande correlação não-linear. 


CORRELAÇÃO DE POSTOS 


Em lugar de utilizar valores amostrais precisos, ou quando tal precisão não 
pode ser atingida, os dados podem dispor-se em ordem de tamanho, de importância, 
etc., utilizando-se os números 1, 2, ..., n. Se dois conjuntos de valores correspon- 
dentes x e y se dispõem em postos dessa maneira, о coeficiente de correlação de 
postos, denotado por posto ou simplesmente por r, é dado por 


654? 
r = Е po А 36 
paño n(n — 1) 146) 
onde r = diferenças entre postos de x e y correspondentes 

n = número de pares de valores (x, y) nos dados. 


A fórmula (36), deduzida no Problema 8.36 é chamada fórmula de coeficiente de 
correlação de postos de Spearman. 
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INTERPRETAÇÃO PROBABILISTICA DA REGRESSAO 


Um diagrama de dispersáo, tal como o da Fig. 8-1, constitui uma representa- 
ção gráfica dos pontos (dados) de uma amostra em particular. Escolhendo amostra 
diferente, ou aumentando o tamanho da amostra original, obteremos em geral um 
diagrama de dispersão diferente. Cada diagrama de dispersão resultaria, então, em 
uma reta ou curva de regressão, muito embora seja de esperar-se que não difiram 
muito entre si, se as amostras são extraídas da mesma população. 

Do conceito de ajustamento de curvas a dados amostrais somos, assim, leva- 
dos ao conceito de ajustamento de curvas à população da qual se extraíram as amos- 
tras. A dispersão dos pontos em relação a uma reta de regressão indica que, para 
determinado valor de x, há efetivamente vários valores de y distribuídos na vizi- 
nhança da reta ou curva. Esta idéia de distribuição conduz naturalmente à conclu- 
são de que existe uma relação entre ajustamento de uma curva e probabilidade. 

Esse relacionamento é visualizado introduzindo-se as variáveis aleatórias X e Y 
que podem tomar os diversos valores amostrais x e y, respectivamente. Por exemplo, 
X e Y podem representar alturas e pesos de adultos do sexo masculino de uma 
população da qual se extraíram amostras. Supõe-se então que X e Y tenham uma 
função de probabilidade conjunta, ou função de densidadde conjunta, f/x, y), 
conforme se trate de variáveis discretas ou contínuas. 

Dada a função de densidade, ou função de probabilidade conjunta, fix, y/ 
de duas variáveis aleatórias X e Y, é natural, de acordo com as observações acima, 
perguntar se existe uma função gf X) tal que 


E([Y-0(X)P) = mínimo (87) 
Uma curva com equação y = g(x) gozando da propriedade (37) é chamada 
curva de regressão de mínimos quadrados de Y sobre X. Temos o seguinte teorema: 


Teorema 8-1: Se X e Y são variáveis aleatórias com função de densidade conjunta, 
ou função de probabilidade, f(x, y), então existe uma curva de 
regressão de mínimos quadrados de Y sobre X, gozando da proprie- 
dade (37), e dada por 


y = gl) = HY|X=x) (38) 
desde que X e Y tenham, cada uma, variáncia finita. 
Note-se que E(Y | Х = х) é a esperança condicional de Y dado X = x, tal 
como definida nas págs. 117 e 118. 


Observagóes análogas valem para uma curva de regressáo de mínimos quadra- 
dos de X sobre Y. Em tal caso, (37) é substituída por 


E([X — h(Y)P) = mínimo 
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e (38) é substituída por x = A(y) = E(X | Y =y). 


As duas curvas de regressão y = g(x) e x= h(y) são diferentes, em geral. 


Caso interessante é aquele em que a distribuição conjunta é a distribuição nor- 
mal bivariada dada por (49), página 168. Temos então o seguinte teorema: 


Teorema 8-2: Se X e Y são variáveis aleatórias com distribuição normal bivariada, 
então a curva de regressão de mínimos quadrados de Y sobre X é 
uma reta de regressão dada por 


Etr (39) 


onde = 08 10 
nas (40) 


representa o coeficiente de correlação da população. 


Podemos também escrever (39) como 


у-у = В — ny) (41) 
в = 21 42 
onde ! E (42) 


Observações análogas valem para a curva de regressão de mínimos quadrados de Х 
sobre Y, que é também uma reta (dada por (39), com X e Y, x e y permutados). 
Comparem-se estes resultados com os correspondentes à página 373. 

Quando não conhecemos f/x, y), podemos ainda usar o critério (37) para ob- 
ter curvas de regressão aproximadas para a população. P. ex., se supomos g(x) = 
— + fix obtemos a reta de regressão de mínimos quadrados (39), onde а, $ são 
dados em termos dos parámetros desconhecidos ку, My» vy, Cy, p. Analogamen- 
te, se g(x) = «+ Вх + ya? podemos obter uma parábola de regressão do míni- 
mos quadrados; etc. V. Problema 8.39. 

De modo geral, todas as observações feitas nas páginas 371 a 378 em relação a 
amostras se estendem facilmente à população. P. ex., o erro padrão da estimativa no 
caso da população é dado em termos da variância e do coeficiente de correlação por 
Ex = plo? (43) 
que deve ser comparado com (25), pág. 375. 


а; 


INTERPRETAÇÃO PROBABILISTICA DA CORRELAÇÃO 


Das observações supra, é claro que um coeficiente de correlação de uma popu- 
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lação deve proporcionar uma medida de quão bem uma curva de regressão da popu- 
lação se ajusta aos dados respectivos. Todas as observações feitas sobre correlação 
amostral se aplicam à população. Por exemplo, se g(x) é determinada por (37), 
entáo " . " = 

E(Y-Yy] = E(Y — Y)*] + El(Yos — Р) (44) 
onde Y.—g(X) e Y=E(Y). 
As três quantidades em (44) são chamadas, respectivamente, variação total, variação 
não-explicada e variação explicada. Isto conduz à definição de coeficiente de 
correlação da população, p, onde 
“variação explicada EF es — Y) 

variação total EI(Y — Yy] 


(45) 


Para o caso linear, esta expressão se reduz a (40). Valem resultados análogos a 
(31)-(34) no caso de uma população e regressão linear. O resultado (45) também é 
usado para definir p no caso não-linear. 


TEORIA AMOSTRAL DA REGRESSÃO 


A equação de regressão y = a + bx se obtém com base em dados amostrais. 
Freqüentemente, interessa-nos escrever a correspondente equação de regressão 
Y=a+Be para а população da qual se extraiu a amostra. Eis alguns testes 
referentes a uma população normal. Para simplicidade de notação, ater-nos-emos à 
convenção usual de mencionar os valores das variáveis aleatórias amostrais, em lugar 
de valores das próprias variáveis. 


1. Teste da Hipótese 8 = b. 


Para testar a hipótese de que o coeficiente de regressão [ é igual a algum 
valor especificado b, valemo-nos do fato de que a estatística 
B—b 


ES y (46) 


tem distribuição de Student com n — 2 graus de liberdade. Tal fato vale também 
para a determinação de intervalos de confiança para coeficientes de regressão 
da população, a partir de valores amostrais. V. Problema 8.43 e 8.44. 

2. Teste de Hipóteses para Valores Previstos 


Seja уо O valor previsto de y correspondente a x = xo € estimado pela equação 


LT 
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de regressão amostral, isto é, уо = @ + Dto. Seja ур o valor previsto de y para 
= Lo , para a população. Então a estatística 


Em (yo — Y) Y R— 24 (47) 
Sys yn + 1 + [то 2)°/8%] 
tem distribuição de Student com n — 2 graus de liberdade. Daí, podemos deter- 
minar limites de confiança para os valores previstos para a população. 


3. Teste de Hipóteses para Valores Previstos para a Média 


Seja yo o valor previsto de y correspondente а z = хо estimado da 
equação amostral da regressão, isto é, yo = а + bæo. Seja d, O valor médio pre- 
visto para y, correspondente a x = xo para a população (isto é, y p=E(Y | X= 


7x9). 


Entáo a estatística 


Lo M- »)vn-2 (48) 
Sys VÀ. + (хо — 33/82 


tem distribuição de Student com n — 2 graus de liberdade. Com base nessa esta- 
tística, podemos determinar limites de confianga para a média prevista para a 
população (v. Problema 8.46). 


TEORIA AMOSTRAL DA CORRELACAO 


Em geral, devemos estimar o coeficiente de correlação p da população a partir 

do correspondente coeficiente amostral de correlação r, ou testar hipóteses sobre 

р . Para tanto, devemos conhecer a distribuição amostral de л. Se p — O essa distri- 

buição é simétrica e podemos utilizar uma estatística que tenha distribuição de 

Student. Se p + O a distribuição é assimétrica. Em tais casos, uma transformação 

devida a Fisher produz uma estatística que tem distribuição aproximadamente nor- 
mal, Os seguintes testes resumem o processo. 


1. Teste da Hipótese р = 0. 


Aqui utilizamos o fato de que a estatística 


(49) 


tem distribuição de Student com n — 2 graus de liberdade. V. Problema 8.47 e 
8.48. 
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2. Teste da Hipótese р 0. 


Aqui, valemo-nos do fato de que a estatística 


2 = inl 


e 1+т 
E = 11518 logo( zh z) (50) 


tem distribuição aproximadamente normal, com média e desvio padrão dados 
por 


1, EEE _ FRA casti 
1 = 510 (т=„) 1,1518 logo (272 nb uses de) 


Esses fatos podem ser usados também para obter limites de confianga para coefi- 
cientes de correlação. V. Problemas 8.49 e 8.50. A transformação (50) é chamada 
transformação Z de Fisher, 


3. Significação de uma diferença entre coeficientes de correlação, 


Para determinar se dois coeficientes de correlação r, e r, relativos a 
amostras de tamanhos x, e n, respectivamente, diferem entre si significativa- 
mente, calculamos Z, e Z,, correspondentes a r, e r, utilizando (50). Levamos 
entáo em conta o fato de que a estatística teste 


L 27 tea 


921—2, 


onde 
Haz, Ва, Pap Ozi- = 


tem distribuição normal. V. Problema 8.51. 


CORRELAÇÃO E DEPENDÊNCIA 


Sempre que duas variáveis aleatórias X e Y têm coeficiente de correlação di- 
ferente de zero, sabemos (Teorema 3-15, pág. 117) que elas são dependentes no 
sentido probabilístico (isto é, sua distribuição conjunta não é fatorável nas dis- 
buições marginais). Além disso, quando p + 0, podemos utilizar uma equação da 
forma (39) para predizer o valor de Y a partir de um valor de X. 

É importante notar que “correlação” e “dependência” no sentido acima não 
implicam necessariamente uma interdependência causal direta de X e Y. Os exem- 
plos que seguem ilustram este fato. 


| 
| 
| 
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EXEMPLO 8.1. Sejam X e Y variáveis aleatórias representando alturas e pesos de indivíduos. 
Aqui, existe interdependência direta entre X e Y. 


Exemplo 8.2. Se X representa salários de professores através dos anos, enquanto que Y repre- 
senta índice de criminalidade, o coeficiente de correlação pode ser diferente de zero e pode- 
mos mesmo chegar a determinar uma equação de regressão que permita predizer o valor de 
uma variável em função da outra. Mas aqui, jamais admitiríamos uma interdependência direta 
entre X e Y. 


Problemas Resolvidos 


A RETA DE MÍNIMOS QUADRADOS 


8.1. Uma reta passa pelos pontos (21, Y1) e (X2, y»). Mostre que sua equação é 


ca = (EM 
y a= (Ea a) 


A equação de uma reta é y = а + bw. Então como (xy, y1) e (s Ya) perten- 
cem à reta, temos 
Y = arde, ya = at bzg 


Assim 
ý (1) 
vw = (aca) — (a+ bz) 
в = boi) 
(a, Ya) 
(2) 
va th mm = (at bra) — (а bz) 
(zo Y1) m by z) 
а 
i tg 
Fig. 8-5 
Levando em (1) o valor b = (ya—y)/(r¿— 21) obtido de (2), vem o resultado 


desejado. 
A Fig. 8-5 exibe o gráfico da reta PQ. A constante b = (ys — yi)/(xa — t) 
é o coeficiente angular da reta. 


8.2. (a) Construa uma reta que aproxime os dados da Tábua 8-1. (b) Determine 
sua equação. 
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Tábua 8-1 


9 11 14 


У 

10 
- 
" d 
8 Pd 
. ^0 
6 "d 
Pid 
4 DPI 
2 

2 e 

H 
P| 


Fig. 8-6 


(e) Grafe os pontos (1, 1), (3, 2), (4, 4), (6. 4), (8, 5), (9, 7), (11, 8)e (14, 9 em 
um sistema de coordenadas retangulares (Fig. 8-6). 
Trace à mão livre uma reta que aproxim ` os dados na figura. Para um método que 
elimine o julgamento individual, у, Problema 8.4 (método dos mínimos quadrados). , 
(b) Para obter a equação da reta construída em (a), escolha dois pontos Р, О, quaisquer 
da mesma. As coordenadas desses pontos, pelo gráfico, são aproximadamente 
(0, 1) e (12, 7,5). Então, pelo Problema 8.1, 


-0) ou y-1=0542% ou y — 1-- 0/542 x. 
8.3. Deduza as equações normais (4), pág. 372, da reta de mínimos quadrados 


V. Fig. 8-7. Os valores de y na reta de mínimos quadrados, correspondentes a 
23,92, <<, Ea 880 


a+ Бад, a+ boa ..., OH bx, У 


Fig. 8-7 
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Os correspondentes desvios verticais são 
dy = а + Вер yn dz а + Ваз A 


d, = а + bx, Yn 


Então a soma dos quadrados dos desvios é 


+ 4$+--- +d? = (а Бау и)? + (а + bas — y)? + +++ + (ad bz, ys)? 
on ХФ = X(atbz—yf 
É uma função de a e b, isto é, F(a, b) = E(a + bx — y)2, Condição necessária para 
que esta expressão seja mínima (ou máxima) é ðF/ða = 0, ak/ab = 0. Como 
or Artio a © 2(a + bx — 
E Xx beu? = EMa+rbr-y) 
aF AO o E i some 
зБ = Zap ББ 02 = J 2x(a+bx-—y) 
obtemos 
Eletba-y) = 0 Уза bey) = 0 
isto é 
By = а +5 doy = «Br + hBa 


como se queria. Pode-se mostrar que essas condições dão efetivamente um mínimo. 


8.4. Ajuste uma reta de mínimos quadrados aos dados do Problema 8.2, utilizando 
(a) x como variável independente, (b) x como variável dependente. 


(a) A equação daretaé y = a + bx. As equações normais são 
dy = am+bXe 
Улу = Br + ЬУ? 


O trabalho de cálculo dos somatórios pode dispor-se como na Tábua 8-2, Embora 
a última coluna não seja necessária nesta fase do problema, foi calculada para ser 


utilizada na parte (b). Ties 82 
T 
1 1 1 | 1 
2 6 4 
4 16 16 16 
4 36 24 116 
| 
5 64 w | 25 
7 8 683 | 48 
8 121 88 | 64 
9 196 i30 | a 
=40 | Ха? = 524 | Say — 364 | 3y? = 256 


8.5. 
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Como há 8 pares de valores de x e y, n= 8, e as equações normais ficam 
Ва + 56b = 40 
Бба + 524b = 364 
Resolvendo simultaneamente, a = -fz ou 0,545, b = 44 ou 0,636; 
e a reta de mínimos quadrados procurada é 
Yy= ўе ou у= 0,545 + 0,636 =. 
Note-se que não é a mesma reta obtida à mão livre no Problema 8.2. 


Outro Método 


ENE» — (EN _ (40524) — (56)(864) 8 


Ig " 

D nXab-— (Sa) = e6 Bep = q O 0,545 
_ nEcy— (Ez)(Zy) , (8)(364) — (56)(40) _ T Р 
à = азат Ga O co По 060 


(Б) Considerando-se x como variável dependente e у como variável independente, a 
equação da reta de mínimos quadrados é x= c + dy e as equações normais são 


Ух = n+dBy 
жу = «Бу + ахи 
Utilizando os valores da Tábua 8-2, as equações normais se escrevem 
8c + 40d = 56 
40е + 256d = 364 


donde c = —1 ou —0,50, d = à ou 1,50. 
Esses valores podem também ser obtidos de 


— (Quay = (Sy ey) _ (561256) — (40864) _ оқу 
a nay? (Ху)? ^ (8856) — (407 , 
| = 952и — (BEM _ (8 860 — (80040) _ | 
ы = ny? — Ey = (8)(256) — (402 ” 
Assim, а equação da reta de mínimos quadrados procurada é ж = —0,50 + 1,50 y. 


Note-se que, resolvendo-se esta equação em relação а y, obtemos y = 0,833 + 0,667 =, 
que não é a mesma reta obtida na parte (a). 


Faça o gráfico das duas retas obtidas no Problema 8.4. 


A Fig. 8-8 exibe os gráficos das duas retas y = 0,545 + 0,686 x 
e x= —0,500 + 1,50 y, 
Neste caso elas são praticamente coincidentes, o que é uma indicação de que os dados 
acusam forte relação linear. 
A reta obtida em (a) é chamada reta de regressão de y sobre x e é usada para 
estimar valores de y para determinados valores de x. A reta obtida em (b) 6 a reta de 
regressão de x sobre y e permite estimar x para dados valores de y. 


"mmm 
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Y 
x = 0,500 + 1,504 
ou 
12 y = 0433 = 0,667 x 


Fig. 8-8 


8.6. (a) Mostre que as duas retas de mínimos quadrados obtidas no Problema 8.4 
se interceptam no ponto (£, y). (b) Estime y para x = 12. (c) Estime x para 
ï= 3. 


Então o ponto (3, Ӯ), chamado centróide, é (7, 5). 
(a) O ponto (7, 5) pertence à reta y = 0,545 + 0,636 x ou mais exatamente 
= Xu + тч? pois 5 = 56; + (7). O ponto máximo (7, 5) pertence à reta 
z-—btiíw pois 7 = —4 + 3 (5). 


m 


Outro Método 


As equações das duas retas são y = 36-1472 e == —4+ By. Resolvendo 
simultaneamente, obtemos x 2 7, y — 5. Assim, as retas se cortam em (7, 5). 
(b) Fazendo x = 12 па reta de regressão de y sobre x, y = 0,545 + 0,636(12) = 8,2. 


(c) Fazendo у = 3 na reta de regressão de x sobre y, ж = —0,50 + 1,50(3) = 4,0. 


8.7. Prove que uma reta de regressão sempre passa pelo ponto (i, Y). 


Caso 1. x é a variável independente. 
A equação da reta de mínimos quadrados é (1) у= а + х 
Uma equação normal para a reta de mínimos = " 
quacradosá (2) Ey = an + ble 
Dividindo ambos os membros de (2) porn: — (8) 4 = «bz 
Subtraindo (3) de (1), vem a reta de mínimos quadrados 
(4) у—ў = bu—2) 
о que mostra que a reta passa pelo ponto (%, Ӯ). 
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Caso 2. y é a variável independente, 


Procedendo como no Caso 1 com x e y permutados entre si e as constantes a e b 
substituídas por c e d, respectivamente, obtemos a equação da reta de mínimos quadra- 


dos 
(5) 


x—ā = dy—y) 


o que indica que a reta passa pelo ponto (2,9). 
Note-se que, em geral, as retas (4) e (5) não são coincidentes, mas se interceptam 


no ponto (2, y). 


8.8. Prove que a reta de regressão de mínimos quadrados de y sobre x pode 


escrever-se na forma (8), pág. 373. 


Temos, de (4) do Probl. 8.7, y — y = b(x — 2). Da segunda equação em (5), pág. 


372, temos 

а) 
Ога, ZX(x—3) 
Também, (2 —2)y — 9) 
Assim, (1) se escreve b 


nXzy — (SxYEw) 
nia? — (Xx) 


5(х2— 270 + 82) 
3e? — 23354 + 54° 


з — 2nzr? + nã? 


— na? 
заз — lxap 
n 


1 2 — (Xa) 
Ln) 

(ху — žy — du + č) 

Say — 23y — Br + 38 


Exy — пу — пуй + my 


Zey — ney 
TOS 
Soy == (EE) 
n 
1 


a 22у — Gay] 


(2 2)(и — 9) 
(z—£) 


donde o resultado (8). A prova de (12), pág. 373, decorre por permuta de x € y. 


h 


—= 
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89. Sejax = x'+h,y=y'+k, he К constantes quaisquer. Prove que 


n2ey — (Ха)(2у) _ ъЗх'у' — (240 (24)) 
næ — (27) ` nar? — (Zx) 


b 


Do Problema 8.8, temos 


nEzy (Xo (Xy) _ Me ëy — y) 
Sœ- 2)2 


e 


nàg? — (Xx) 


Massex=x +h, y = у tk temos 


@ = xi +h y 
Assim My _ 
(a — 2)2 


O resultado é útil para a elaboração de um método abreviado para determinação 
de retas de mínimos quadrados, subtraindo-se constantes convenientes dos valores 
dados de x e y (v. Problema 8.12). 


8.10. Se, em particular, № = #, Е = 9 no Problema 8.9, mostre que 
i Sey 


Decorre imediatamente do Problema 8.9, pois 
Iy = X(e—2) = Ex—nã = 0 
e analogamente 3y'=0. 


8.11. A Tábua 8-3 exibe as alturas respectivas, x e y, de uma amostra de 12 pais e 
seus filhos mais velhos, (а) Construa um diagrama de dispersão. (b) Determine 
a reta de regressão de mínimos quadrados de sobre x. (c) Determine a reta 
de regressão de mínimos quadrados de x sobre y. 


Tábua 8-3 


[ ate x do pai (pois) [es 63 67 64 68 62 70 66 68 67 69 71 


| Alt. y do filho (pols.) 68 66 68 65 69 66 68 65 71 67 68 70 


(a) O diagrama de dispersão (Fig. 8-9) é obtido grafando os pontos (x, y) em um 
sistema retangular de coordenadas. 


(b) A reta de regressão de y sobre x é dada por y = a + bx, onde a e b se obtêm da 
resolução simultânea das equações normais 
Xy = ап + b3x 
Say = ada + bla? 
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= -3,38 + 1,036 y~ 
ii d mos 


Alt. do filho (polegs.) 


Um T A T T I g 


62 84 66 68 70 72 
Altura do pai (pols.) 


Fig. 8-9 


As somas constam da Tábua 8-4; as equações normais são 
12а + 800b = 811 


8004 + 53,4186 = 54,107 


Tábua 8-4 


y zi xy ap 


68 4225 4420 4624 
66 3969 4158 4356 
68 4489 4556 4624 
65 4096 4160 4225 
69 4624 4692 4761 
56 3844 4092 4356 
68 4900 4760 4624 
65 4356 4290 4225 
т1 1624 4828 5041 
67 4489 4489 4489 
se 4761 4692 4624 
5041 4970 4900 


Ex? = 53.418 Zxy = 54.107 Zyº = 54,849 
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donde а = 35,82, b=0,476 e y 235,82 + 0,476 x. A Fig. 8-9 exibe o gráfico 
desta reta. 


Outro Método, 
— Guys?) — (2) 
nda (Ex) 


(С) A reta de regressão de x sobre у é dada por x = c + dy, onde с e d se obtêm da 
resolução simultânea das equações normais 
Ух = сп + dy 
Уту = сЗу + азу? 
Utilizando as somas da Tábua 8-4, vem 
12с + 8114 - 800 
8l1c + 54,840d = 54,107 


onde c = —3,38, d = 1,036 e x= -3,38 + 1,036y. O gráfico da reta acha-se na 
Fig. 8-9. 


n3xy — (®х)(®у) 


= 3582 p = aa ш 0476 


Outro Método. 


— Boy) — (Xy)ey) 
= п5у? — (2y)? 


п5 ху — (®у)(®х) _ 


= 338 d= Y = 1086 


8.12. Faga o Problema 8.11 utilizando o método do Problema 8.9. 


Subtraia um valor conveniente, digamos 68, de x e de y (os números subtraídos 
de x e de y podem, naturalmente, ser diferentes), Isto conduz à Tábua 8-5. 


Tábua 8-5 
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Da Tábua obtemos 


тату — (ENE) _ (02)47) — (165) _ 
Ae n5c2— (50)2 — 018)006) — de? ^ 0,476 
Outrossim, como Z' = z —68, y' = y — 68 temos 27 =2-68, у =7-68. 
Assim 
E 16 " = 5 
a=W+68 = —qg (08 = 0687, d=w+6=-,+6 = 67,58 


A equação de regressão procurada de y sobre x é y — 9 = b(x — ë), Le. 

y — 67,08 = 0,476(x — 66,07) ou y = 35,85 + 0,476 x 
o que concorda com o Problema 8.11, a menos de erros de arredondamento. De modo 
análogo podemos obter a reta de regressáo de x sobre y. 


EQUAÇÕES NAO-LINEARES REDUTIVEIS À FORMA LINEAR 


8.13. A Tábua 8-6 dá os valores observados da pressão P de certa massa de gás 
correspondente a diversos valores do volume V. De acordo com os princípios 
da termodinâmica, deve existir entre as variáveis uma relação da forma 
рү” = C, onde y e C são constantes. (a) Determine os valores de y e С 
(b) Escreva a equação que relaciona P e V. (c) Estime P para V = 100,0 pole- 
gadas cúbicas. 


Tábua 8-6 


Volume V (pols.?) 54,3 61,8 | 724 88,7 118,6 194,0 


| Pressão Р übs/pol) | 612 | 495 | 375 | 284 | 192 104 


a) 


Como РУ” = C, temos, tomando logaritmos decimais 
log P + vylogV = logC ou lgP = logC — ylogV 

Fazendo 

lgV-—z e logP=y, 
a última equação pode ser escrita 
у = act bx 
onde 
a=lgC e Ь=-ү. 

A Tábua 8-7 dá os valores de x e y correspondentes aos valores de V e P na 
Tábua 8-6 e também indica os cálculos para determinação da reta de mínimos quadra- 
dos (1). 

As equações normais correspondentes à reta de mínimos quadrados (1) são 


Xy = an +d%e Жей = ala + bat 
donde 
_ Ey) — (®ж)(®ху) _ _ nÀzy —(3z 3v) _ 
= 1549 — (Er)? = da = 7 O 


Então y = 4,20 — 1,404. 
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ж =1l0g V у= ЕР | E] xy 


1,7348 1,7868 3,0095 
1,7910 1,6946 3,2077 
1,8597 1,5752 3,4585 
1,9479 1,4533 3,7943 


a a AO 


"m 


2,0741 1,2833 4,3019 
2,2878 1,0043 5,2340 


E Ex = 11,0953 2y = 8,7975 Xa? = 28,0059 Boy = 16,8543 


(a) Сото а = 4,20 =logC е b=-140=-—y, С= 160x105 е у= 140. 
(b) PV1,0 = 16,900. 
(с) Quando V = 100, х — logV —2 e y= logP = 420 — 1,40(2) = 1,40. 

Então P = antilog 1,40 = 25,1 Ib/pol? 


so 


P 


Pressão 


| 
1 
| 
| 
э 4 
1 
I 


10 э E) 30 м 5) тою 90 100 aso 200 250 200 
Volume У 


Fig. 8-10 
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8.14. Resolva o Problema 8.13 grafando os dados em papel log-log. 


Para cada par de valores da pressão P e do volume Y na Tábua 8-6, obtemos um 
ponto que é grafado no papel especial log-log exibido na Fig. 8-10. 

Indica-sé também uma reta (traçada à mão livre) que aproxima esses pontos. О 
gráfico resultante mostra que há uma relação linear entre logP e logV, a qual pode ser 
representada pela equação 


logP = a+blogV ош у= atbz 


O coeficiente angular b, que é negativo no caso, é dado numericamente pela razão 
do comprimento de AB para O comprimento de AC. No caso, temos b = — 1,4. 
Para determinar a, precisamos de um ponto da reta. P. ex., quando V = 100, 


Р = 25, pelo gráfico. Então, 
ъ= logP — blogV = log25 + 1,4 106100 = 14 + (1062) = 42 
de forma que 


log Р + 14logV = 42, log PV = 42, e PVIA = 16,000 


A PARÁBOLA DE MINIMOS QUADRADOS 


8.15. Deduza as equações normais (19), pág. 374, para a parábola de mínimos 


quadrados 
y = a+bx+ca 
Sejam os pontos amostrais (zy, Y1), (La Y2)» ++.» (жь, ун). Então os valores de 
y na parábola de mínimos quadrados correspondentes à Sir #2, ..., а 
ad bx, tes а Баз Бед, o a+ bz, + ex; 
Assim, os desvios em relação à уз, Ya, ++» Yn são dados por 
d, = a+ ьа + cs?— yy da = ата е Ya -u dr 


= a+ bx, + 6x2 — Yn 
e a soma dos quadrados dos desvios é dada por 
EL = Ў (0+6 + с? – y) 


É uma função de a, b e c, isto é 
F(a,b,c) = (a+ bz + er? y)? 
A fim de minimizar a função, devemos ter 


Po Pg) Fo 
sm 9 gE о о go 
Ora Е 
= EXieeeset-g? = Хао) 


E 
E 


A isi 
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Ш 


PES 2€ 5 (а ba + ext — y)? B eat be + ол® — y) 


E 


X 2x9(a + ba + ex? — y) 


I NE E R 
T = Ett te) 


Simplificando cada um dos somatórios acima e igualando-os a zero, obtemos as equações 
(19) da página 374. 


8.16. Ajuste aos dados da Tábua 8-8 uma parábola de mínimos quadrados da forma 


y=a+ba+ca? 
Tábua 8-8 


31 49 57 71 86 98 


70 718 72 68 45 27 


As equações normais são 


Sy = ап + 055 + cxx? 
(2) Bay = «Br + Ьа? + cla 
а?у = ľa? + bE | cXxi 
O trabalho de cálculo dos somatórios pode dispor-se como na Tábua 8-9. 
Tábua 8-9 
A 
x y a? xi E ET ahy 
— а. +— 
1,2 4,5 1,44 1,73 2,08 5,40 6,48 
18 59 3,24 5,83 10,49 10,62 19,12 
31 7,0 9,61 29,79 92,35 21,70 67,27 
49 7,8 24,01 117,65 576,48 38,22 187,28 
5,7 7,2 32,49 185,19 1055,58 41,04 233,93 
ті 88 50,41 357,91 2541,16 48,28 342,79 
8,6 45 73,96 636,06 5470,12 38,70 332,82 
9,8 2,7 96,04 941,19 9223,66 26,46 259,81 
Ex= Ey = 322 = 3e = day = Zey = 
42,2 46,4 291,20 2275,35 230,42 1449,00 
Então, como л = 8, as equações normais (1) se escrevem 
8 4 91, = 464 
" а + 42,2 + 291,20 0 | 


42,2 а + 291,20 b + 2275,35 с = 230,42 
291,20 a + 2275,85 b + 18971,92 0 = 1449,00 


8.17. 
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Resolvendo, obtemos а = 2,588, b = 2,065 e e = — 0,2110; donde a equação da parábo- 


la de mínimos quadrados 
y = 2,588 + 2,065 x — 0,2110 *% 


Use a parábola de mínimos quadrados do Problema 8.16. para estimar os valo- 
res de y a partir de valores dados de x. 


Para == L2, Yes: = 2,588 + 2,065(1,2) — 0,2110(1,2)? = 4,762. 


Analogamente, obtêm-se outros valores estimados. A Tábua 8-10 exibe os resultados, de 
confronto com os valores observados de y. 


Wess | 4,762 


| у | 45 | 59 | 7,0 | 78 | 72 


Tábua 8-10 


—— 


5,621 | 6,962 | 7,640 7,508 | 6,613 | 4,741 | 2,561 


68 | 45 | 27 


| 
1 
| 


REGRESSÃO MULTIPLA 


8.18. 


8.19. 


Uma variável z deve ser estimada a partir das variáveis x e y mediante uma 
equação de regressão da forma 2 =4 + bx + cy. Mostre que a equação de re- 
pressão de mínimos quadrados se obtém determinando a, b e c de modo a 
satisfazerem (21), pág, 375. 


Sejam os pontos amostrais (2 Vp 2)» «++» lEn Yw Zn). Então os valores de 
z no plano de regressão de mínimos quadrados correspondentes а (#1, Y1), -- «> (Xnr Yn) 


sáo, respectivamente, 
a+ be + су, 254 O + bx. CVs 


Assim, os desvios a contar de 21, ..., Zn são dados pot 
d, = &d ba + e ces d, = 0 + bz, + cy. — En 
e a soma dos quadrados dos desvios é 
Xd? = Elatbr+ey—a? 
Considerando esta expressão como função de а, b, c e igualando a zero as derivadas 
parciais em relação a q, b, с, obtêm-se as equações normais (21) da pág. 375. 


A Tábua 8-11 dá, para 12 meninos, os pesos z com aproximação de 11b., as 
alturas x com aproximação de 1 polegada, e as idades y com aproximação de 
1 ano. (4) Determine a equação de regressão de mínimos quadrados de z 
sobre x e y. (b) Determine os valores estimados de 2 a partir dos valores dados 
de x e y. (c) Estime o peso de um menino de 9 anos e 54 polegadas de altura. 


Tábua 8-11 
[ Peso 64 | 71 | 53 | вт | 55 | 58 | 77 | 57 | 56 | 51 | 76 | 68 
Altura 57 | 59 | 49 | 62 | 51 | 50 55 | 48 | 52 | 42 | 61 | 5T 


Idade 8|10 e | dd 10 9 | 10 6 12 9 


398 PROBABILIDADE E ESTATISTICA 


(a) A equação de regressão linear de z sobre x e y pode ser escrita 2 = а + by + ey 
As equações normais (21), pág. 375, são dadas por 
Iz = na + bEx+4cXy 
(2) Zez = ахз + bla? + cXay 


Хуг = азу + bEey + cBy? 
O trabalho de cálculo dos somatórios pode ser disposto como na Tábua 8-12. 


Tábua 8-12 
E y E uz зу 
3249 64 3648 512 456 
3481 100 4189 710 590 
2401 36 2697 318 294 
3844 121 4154 737 682 
2601 64 2805 _ 440 408 
2500 49 2900 406 350 
3025 100 4235 770 550 
2304 81 2736 513 432 
2704 100 2912 560 520 
1764 36 2142 306 252 | 
3121 144 4636 912 1732 
3249 81 3876 612 513 4 
Est - IP= | Iz= | Xu- | Хау = 
34,843 276 40.830 6796 | 5779 


Utilizando esta Tábua, as equações (1) se escrevem 
12a + 643b + 106c = 753 
(2) 643a + 34,843b + 5779c = 40,830 
106a + 5779b + 976c = 6796 


Resolvendo, vem a = 3,6512, b = 0,8546, с = 1,5063 e a equação de regressão procura- 
daé 
(3) z = 8465 + 0,855 х + 1,506 y 
(b) Utilizando a equação de regressão (3) obtemos os valores estimados de z, denotados 
por Zest» substituindo os correspondentes valores de x e y. A Tábua 8-13 dá os 
resultados, juntamente com os valores amostrais de z. 
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Tábua 8-13 


RR! i 
p 64,414 | 69,136 | 54,564 | 78,206 | 59,286 56,085 | 65.717 58,229 | 63,153 | 48,582 113,851 | 65,920 


E 


64 т 53 67 55 58 | 77 57 56 51 


тв | 68 


(c) Fazendo х = 54 e y = 9 em (3), o peso estimado correspondente é Zes = 63,356, 


ou seja, cerca de 63 Tbs. 


ERRO PADRÃO DA ESTIMATIVA 


8.20. Se a reta de regressão de mínimos quadrados de y sobre x é dada por 


8.21. 


y = a+ bx, prove que o erro padrão da estimativa Sy» é dado por 
Sy? — ay — bBay 
n 
Os valores de y estimados a partir da reta de regressão são dados por 
= a+ ba. 


Sia = 


Então, 
o _ XU-W9  Ey-a-be? 
Ss Dn So Ta 
— Buly—a— bz) — aX(y — a — ba) — Ьу — a — be) 
n 
Mas 


X(y—a-—bz) = Xy —an—bl2e = 0 
Sxa(y—a—bx) = Isy — ade — b3 = 0 
pois, das equações normais, 
Xy = an + 55% Зу = ах + b3a? 


Entáo 


> _ Ууу—а— ba) - Zy?-—aXy-— 


s 
= n т 
Este resultado pode ser estendido a equações de regressão não-lincar. 


E 


Prove que o Resultado no Problema 8.20 pode escrever-se 
ы. - 20-00-0502 900—0 


de 
a n 


Método 1. 


Seja œ = х’ +2, y — y' +9. Então, do Problema 8.20 
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= Eyi— aXy— b3ay 

= My +9) — а2(у' ty) — bE + ®)(у' +9) 

= З(у?+ 20+ ф°) — o(Xy! mj) — Б (у y +09 + 20) 

= Xy?-ck2jXy + ng? — ang — bXa'y— bw — bjBa' — bung 


= Iy? + ng? — ang — bEz'y! — bnajy 
= 3y? — bXs'y conj(-—a-— ba) 

= Xy? bà 

= My 9)? — b2E(u— ly — 9) 


onde utilizamos os resultados La” = 0, 3y’ = 067 = a + b£ (que decorre dividindo 
ambos os membros da equação normal Ху = an + bEx рог п). Isto prova o resultado 
desejado. 


Método 2, 
Sabemos que a reta de regressão pode ser escrita como y — j = blæ — 2), o que 


corresponde a partir de y = a + bx e substituir a por zero, x por x —x € y por y — y. 
Feitas estas substituições no Problema 8.20, obtém-se o resultado procurado. 


8.22, Calcule o erro padrão da estimativa s, „ para os dados do Problema 8.11. 


Pelo Problema 8.11(5), a reta de regressão de y sobre x é y = 85,82 + 0,476 v. 
Na Tábua 8-14 encontram-se relacionados os valores observados de у (da Tábua 8-3) 
bem como os valores estimados de y, denotados por Vesr, tais como obtidos da reta de 
regressão. P. ex., correspondente a x =65 temos ме = 35,82 + 0,476(65) = 66,76. 


Relacionam-se também os valores de Y — yos necessários para o cálculo de 


Sua 
Tábua 8-14 
— 
ш 65 63 67 64 68 62 70 66 68 67 69 ті 
Y os | 66 | 68 | 65 | 69 | 66 | 68 | 65 | TL | OT | 68 | то 


Ves | 86,76 | 65,81 | 67,71 | 66,28 | 68,19 | 65,83 | 69,14 | 67,24 | 68,19 | 67,71 | 68,66 | 69,62 


_ EU Ys (Las + (0,19)? +--+ + (0,88)2 _ ids 
E x С" 12 i 


е ву, = V1,642 = 1,28 pols. 
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8.23. (a)Construa duas retas paralelas à reta de regressão do Problema 8.11 e às dis- 


tâncias verticais бу da mesma. (b) Determine a percentagem de pontos que 
caem entre essas duas retas. 


(a) A reta de regressão y = 35.82 + 0.476 х obtida no Probl. 8.11, aparece em traço 
contínuo na Fig. 8-11. As duas retas paralelas, cada uma a distância vertical зух = 1,28 
(v. Probl. 8.22) dela, aparecem tracejadas па Fig. 8-11. 


y 


124 


Fig. 8-11 


(b) Pela figura vê-se que dos 12 pontos, 7 caem entre as retas, enquanto que 3 aparen- 
tam estar sobre as retas. Um exame mais detalhado utilizando a última linha da 
Tábua 8-14 indica que, na realidade, 2 desses 3 pontos estão também entre as linhas. 
Então a percentagem procurada é 9/12 = 75% 


Outro Método. 


Da última linha na Tábua 8-14, y — Yes, está entre —1,28 e 1,28 (isto é, = 
para 9 pontos (x, y). Então, a percentagem procurada é 9/12= 75% 

Se os pontos se distribuem normalmente em torno da reta de regressão, pode-se 
prever que cerca de 689% deles estejam entro as retas. Este teria sido o caso se a 


amostra tivesse sido maior. 
NOTA: Uma melhor estimativa do erro padrão da estimativa da população da qual se 
extraiu a amostra de alturas é dada por 


Bu. Vna 2) sys = VAO (1,28) = 1.40 pol. 


402 PROBABILIDADE E ESTATÍSTICA 


O COEFICIENTE DE CORRELAÇÃO LINEAR 


8.24. 


8.25. 


Prove que 
My — 9)? = My — ves) + (уо: — YY? 


Elevando ao quadrado ambos os membros de y — Y = (y — Yes) + (r7 Y) e 


somando, temos 

X( —4? = Ely yo)? + Xu — D+ 22(y — Yos) Yes — 9) 
O resultado procurado decorre imediatamente, desde que possamos mostrar que a última 
soma é zero. Na regressáo linear este é realmente o caso, pois 


Ely — у.) 0) = Ely —a— ba)(a+ ba — 9) 
= a3(y—a— ba) + dbEx(y —a— bx) — yX(y — а — bz) 
= 0 


em virtude das equações normais 
3(y—a—bx)=0, Ez(y—a-— bx) = 0. 
Pode-se mostrar analogamente que o resultado também é válido para regressáo 
náo-linear utilizando-se uma curva de mínimos quadrados dada por 


Vest = ар aux + agg? ++ + auam. 


Calcule (a) a variação explicada, (b) a variação não-explicada e (c) a variação 
total para os dados do Problema 8.11. 


Тетоѕӯ = 67,58 do Problema 8.12 (ou da Tábua 8-4, pois 
ӯ = 811/12 = 67,58). 
Utilizando os valores Y os; da Tábua 8-14, podemos construir a Tábua 8-15. 


Tábua 8-15 


8.26. 


(a) Variação explicada = X(y,,,— #)° = (0,8232 + ++ + (2,04)? = 19,22. 
(b) Variação não-explicada = 3(y — Yesi)? = "sy, = 19,70, pelo Problema 8.22 


Wr 


(c) Variação total = 3(y— 9)? = 19,22 + 19,70 = 38,92, 38,92 pelo Problema, 24. 


Os resultados em (b) e (c) podem ser obtidos também por cálculo direto da soma de 
quadrados. 


Determine (a) o coeficiente de determinação e (5) o coeficiente de correlação 
para os dados do Problema 8.11. Use os resultados do Problema 8.25. 


Variação explicada _ 19,22 . 0,4938 
Variação total 38,92 


(a) Coeficiente de determinação = 7? = 


(Б) Coeficiente de correlação = r = жу 0,4988 = +0,7027. 
Como a variável Yes; aumenta quando x aumenta, a correlação é positiva e 
escrevemos então r = 0,7027, ou 0,70 com dois algarismos significativos. 
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8.27. Partindo do resultado geral (30), da pág. 377, para o coeficiente de correla- 
ção, deduza o resultado (34), pág. 377 (fórmula do momento-produto) no 
caso da regressão linear. 


A reta de regressão de mínimos quadrados de y sobre x pode escrever-se 
Ve =0+bx ou gia = bx", 
onde 

b= Zz'y/Xzr?, a =w, е Wes = Wen 9. 
Usando então y = y — 9, temos, 


12 = Variação explicada _ Yes: — 02 & Xy 
Variação total Z(y— y? zy? 
_ Eb _ 02552 _ Iry 2 /Xa' — (Gay) 
xy?  — Xy? — E 2/13y2) " Ба? Xy? 
xy 


© assim T = 
Vix”? E 


Todavia, como 'у/ é positivo quando Yest aumenta com x, mas negativo se 
Jest diminui quando x aumenta, a expressão de г já apresenta automaticamente о sinal 
correto. Tem-se assim, o resultado desejado. 


8.28. Utilizando a fórmula do momento-produto, obtenha o coeficiente de correla- 
ção linear para os dados do Problema 8.11. 


O trabalho de cálculo pode dispor-se como na Tábua 8-16. Então 
ij 
_ Bey Е 40,34 = 0,7027 
VE?) v(84,68)(38,92) 


o que está de acordo com o Problema 8.26(b). 


Tábua 8-16 
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8.29. Prove o resultado (17), página 374. 


A reta de regressão de y sobre x é 


Y8y 
y = а+ ғ onde b = — 
$a 
Analogamente, a reta de regressáo de x sobre y é 
TS. 
= = с+ у onde os 
Sy 


Entáo 
T8, 
кш dl! ia 
8.) \ 8y 


8.30. Use о resultado do Problema 8.29 para determinar o coeficiente de corre- 
lação linear para os dados do Problema 8.11, 


Do Problema 8.11(b) e 8.11(c), respectivamente, 


484 _ _ 484 _ 
b = jog 0476 а = 467 = 1086 


484 184 
2 — = {27 pos = 07 
ш ni (5) ( 2 qu ы oroar 


o que concorda com os Problemas 8.26(b) e 8.28. 


Então 


8.31, Mostre que o coeficiente de correlação linear é dado por: 
ees (0 nàÀxy — (2а)(2у) 
vns? — (30) [n2y? — (yY] 


No Problema 8.27, mostramos que 


a) "ES xay, ЕД (x — 3y — 0) 
Va?) 39) УЗ (@— Py 37 
Mas 
X(z—$)(y—43) = Bey — 20 — ey +49) Say — 25у — 952 + паў 
Say — nij — nyz + ney = lay — ny 
= — Gay) 
= ley a 


pois 2 =(22)/ne q = (®и)/п. 
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Analogamente, Z(y —4)? = (02—202 +8?) = Za? — 2435 + nz? 
= Жай 220 y (а) gg a (=) 
n п. п. 
е 
=p = xp EY 
Z(y- 2 = By = 
Então (1) se escreve 
— 1 22y — (a) 3m = nZay — (Zx)3y) 
VE Cp? (ym) Уа — (Ха) [n y? (2y)?] 


8.32. Use a fórmula do Problema 8.31 para obter o coeficiente de correlagáo linear 
para os dados do Problema 8.11. 


Da Tábua 8-4, 
nãay — (Se)(Ey) 
[n3 «2 — (32)2] [n3 y? — (3y)2] 
" (12)(54,107) — (800)(811) = dm 
V [(12)(63.418) — (800)2][(12)(54.849) — (811)] 
tal como nos Problemas 8.26(b), 8.28 e 8.30. 


т = 
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3.33. (a)Determine o coeficiente de correlação linear entre as variáveis x e y do 
Problema 8.16. (b) Determine um coeficiente de correlação não-linear entre 
essas variáveis, admitindo a relação parabólica obtida no Problema 8.16(c). 
Explique a diferença entre os coeficientes de correlação obtidos em (a) e (b). 
(d) Que percentagem da variação total permanece não-explicada na hipótese 
da relação parabólica entre x e y? 


(a) Utilizando os cálculos da Tábua 8-9 e o fato que Z y? — 290,52, obtemos 


ny — (®х)(®у) 


" (8)(230,42) — (42,2)(46,4) 
te == : = 0,3743 
v [(8)(291,20) — (42,2)5][(8)(200,52) — (46,4)7] 


(b) Da Tábua 8-9 y = (Ey)/n = (46,4)/8 = 5,80. Então 
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Variação total = X(y— 7)? = 21,40 


Da Tábua 8-10 


Variação explicada = X(Yost — 9? = 21,02 
Assim, 
ji. Variação Explicada _ 2102 09822 e r= 0,9911 
Variação Total 21,40 * d 


(c) O fato de (a) acusar um coeficiente de correlação linear de apenas —0,3743 indica 


praticamente a ndo-existéncia de relação linear entre x € y. Todavia, há uma relação 
não-linear muito boa dada pela Parábola do Problema 8.16, pois o coeficiente de 
cortelação em (b) é muito próximo de 1. 


(d) Variação ndoexplicida _ 1 _,2=1-0,9822= 0,0178 
Variagáo Total 


Assim, 1,78% da variação total permanecem não-explicados. Isto pode ser devido 
a flutuações aleatórias ou a alguma variável adicional que não tenha sido considerada, 


8.34. Determine (а) зу е (b) зу у para os dados do Problema 8.16. 


(2) Do Problema 8.33(5), (у — q)? = 21 40. Então o desvio padrão de y é 
з = À | Hu mil p» - ES = 1,686 ou 1,64 
(b) Primeiro Método. 
Utilizando (a) e o Problema 8.33(b), o erro padrão da estimativa de y sobre x é 


Sus = VI-A = 1686/1—(09910? = 0,218 ou 0,22 
Segundo Método. 


Usando o Problema 8.33 
= 4 Ely — Ve)? _ "| Variação não-explicada MET —21,02 


E 
Lid n n 8 


= 0,218 ou 0,22 
Terceiro Método. 
Usando o Problema 8.16 e o resultado adicional Xy? — 290,52, temos 


Xy -—a€y-—0Xey CY noi 
su = EDT = 0,218 ou 0,22 


n 


8.35. Explique como determinaria um coeficiente de correlação múltipla para as 
variáveis do Problema 8.19. 
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Como z é determinado a partir de x e y, estamos interessados no coeficiente de 
correlação múltipla de z sobre x e y. Para obtê-lo, vemos do Problema 8,19 que 
Variação Não-Explicada = X(2— Zest)? 
= (64 — 64,414)? + «+. + (68 — 65,920)? = 258,88 
Variação Total = X(z—2)9 = 522 — nã? 
48,139 — 12(62,75)2 = 888,25 
Variação Explicada — 888,25 — 258,88 — 629,37 


Então 
Coeficiente de correlação múltipla de z sobre x e y 
Vue Explicada V ЭЁ conem 
Variação Não-Explicada 888,25 : 


Note-se que, se fôssemos _ considerar a regressão de x sobre y e z, o coeficiente de 
correlação múltipla de x sobre y c z seria em geral diferente do coeficiente acima. 


CORRELAÇÃO DE POSTOS 
8.36. Deduza a fórmula de Spearman para a correlação de postos (36), pág. 378. 


Aqui, estamos considerando n valores de x (p.ex., pesos) e п valores correspon- 
dentes de y (p.ex., alturas). Seja x; o posto atribuído ao /MO- valor de x, c уу posto 
atribuído ao MO. valor de y. Os postos são os inteiros de 1 am. A média de x; é então 


1424 ++ 2 n(n1/2 _ +1 


o n n 2 


€ a variância é 


. Pretto (m1? 
D n 2 


m(n--1)gn 1/6 — /n-1V 
2 2 


n—1 
12 
utilizando os resultados de 1 е 2 do Apêndice A. Analogamente, a média y c a variância 


sz são iguais а (n +1)/2 e (n? — 1)/12 respectivamente. а 
Se d¡= Xj — yj são os desvios entre os postos, a variância dos desvios, sj, é dada 
em termos de з2, a e do coeficiente de correlação entre postos, por 


2 2 2 
ва = 87 + ву — 2 Fpostosz Su 


Então FS s2 — аў 
Tposto — 28,8, 
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837. 


Como d —0, sj = (Zd2)/n, e (1) se escreve 


(8—1/2 + 08—1/2-(3dn _ , 620 
(n? — 1/6 = (Gi — 1) 


Fposto = 


A Tábua 8-17 mostra os postos atribuídos a 10 estudantes, conforms seus 
resultados em leitura e prática de laboratório de um curso de biologia. Deter- 
mine o coeficiente de correlação de postos. 

Tábua 8-17 


Laboratório 


Leitura 


A Tábua seguinte dá a diferença de postos d entre leitura e laboratório, para cada 
estudante. Constam também da tábua d? e Bd? 


Tábua 8-18 


Diferença de postos, d E 2 -t 1 =i 3 i 


di 1 4 jj 1 1 9 1 


8.38. 


= фе а sea _ 5 
poto = 1 may ^ tomo) 7 955% 
indicando acentuado relacionamento entre os resultados de prática de laboratório e 
leitura. 


Então p 


Calcule o coeficiente de correlação de postos para os dados do Problema 8.11 
e compare o resultado com o coeficiente de correlação obtido por outros 
métodos. 


Dipostas em ordem ascendente de grandeza, as alturas dos pais são 
[69] 62, 63, 64, 65, 66, 67, 67, 68, 68, 69, 70, 71 
Como о 69 ео 79 lugares acusam а mesma altura, atribuímos а ambos о posto médio 
6,5. Analogamente, aos 89 е 99 lugares foi atribuído o posto 8,5. Assim, as alturas 
dos pais tém os postos 


(2 1,2,3,4,5, 6,5, 6,5,8,5,8,5, 10, 11, 12 


Analogamente, as alturas dos filhos dispostas em ordem ascendente de grandeza 


(3) 65, 65. 66, 66, 67, 68, 68, 68, 68, 69, 70, 71 
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e como о 60, о 79,089 со 92 lugares correspondem à mesma altura (68”), atribuímos 
a cada um deles o posio médio 7,5 [(6 + 7 +8 + 9)/4] Assim, as alturas dos filhos têm 
os seguintes postos 


(4) 11531,5535; 8,995: 55 7,95 7,55 7,5510: 115 12 


Utilizando as correspondéncias (1) e (2), (3) e (4), a Tábua 8-3 se escreve 


Tábua 8-19 
Posto do pai 4 2 65 3 85 1 11 5 85 65 10 12 
Posto do filho 75 35 "5 15 10 85 7,5 15 12 5 75 11 


A Tábua 8-20 dá a diferença d entre postos e os cálculos de d? e Ed? 


Tábua 8-20 


d| 35 15 10 15 -—L5 -25 35 35 -35 15 25 10 


d2| 12,25 225 1,00 225 225 626 1225 1225 1225 225 625 1,00 эйе 
72,50 
киын 6502 6(72,50) 
[2 = E gui e 5,90) _ 4 
posto lc xij 1— топозу 0,7465 


о que concorda muito bem com o valor г = 0,7027 obtido no Problema 8.26(b). 


INTERPRETACAO PROBABILISTICA 
DA REGRESSÃO E DA CORRELAÇÃO 


8.39. Deduza (39) a partir de (37). 
Suponha a equagáo de regressáo 


y = Е(Ү|Х= х) = a Вх 
Para a reta de regressão de mínimos quadrados devemos considerar 
E(Y —(- BB) = EQQY— ty) — P(X x) + (uy — Bax — 18 
= E[(Y — uy] + 8?E((X — их)? — 28E [X — ax (Y — uy) | + (uy — Вих — а) 


3 


= аф + Blok — 2Bexy + (y — Bux — a)? 


2 


onde usamos E(X — ax) = 0, E(Y — uy) = 0. 
Denotando a última expressão por F(a, B) temos 
ағ _ oF _ 2 
da = "Mr Вих а), yg = ?боу — Zoxy — 2uy(py — Bux — a) 
Igualando a zero essas derivadas (condição necessária para que (0, f) seja mínimo), 


obtemos E 2 
ty = «+ Bux Box = exy 
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Assim, se y = @ + fx então y — uy = B(x — ux) ou 


_ xy 
ver = ca (md 
x 
y — uy 2 — ux 
ou ——— р 
oy ox 


Deve-se notar a analogia entre a prova acima, para populações, utilizando espe- 
tangas, com a prova correspondente para amostras, utilizando somatórios. Em geral, os 
resultados obtidos para amostras têm seus correspondentes para populações e vice-versa. 


8.40. A função de densidade conjunta das variáveis aleatórias X e Y é 


Hr +29) 0<o<1, 0«y«1 
en = " 
0 em caso contrário 
Determine a curva de regressão de (д) Y sobre X, (b) X sobre Y. 
(a) A função de densidade marginal de X é 
1 2 2 
= Z(zc2y)]dy = tI 
ne = f fatui = gern 


para 0< z< 1, е f,(x) = 0 em caso contrário. Logo, para 0 <= & 1, a densidade 
condicional de Y dado X é 


х + 2y 


Flevy) 0<y<l 
C = DOS — zl 
fatu | х) fe) 
0 y<0oy>1 
e a curva de regressão de Y sobre X é dada рог 
; Р 
у = EY|X-s) = f y faly |=) dy 


Nem fa(y x) nem a curva de regressão se definem quando z < 0 ouz > 1. 


(b)Para 0< y < 1 a função de densidade marginal de Y é 


1 
AQ = f $6 m)dz - tatan 
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Logo, para 0 < y Y 1, a densidade condicional de X dado Y é 


А 2x + 4y 
fiel = дй = IE Aa 
in «000221 


e a curva de regressáo de X sobre Y é dada por 


Р 
а = EX|Y=p = f алада 
1 
a 2х + 4у s Ts 
E Í (ЫЕ) = оу 
Nem f, (x | y) nem a curva de regressão se definem quando 
у< 0 ou у>] 


Note-se que as duas curvas de regressão 


y = (9x +4)/(6x +6) е а = (24 60)/(8 + 12y) 
sáo diferentes. 


841. Determine (a) X, (b) Y, (c) 02, (d) o3, (e) «ху, (f) p 


para a distribuição do Problema 8.40. 
H Al 
S P" 
(a) Pe EK. 1 ШЕ; 
" 1 1 2 ü 
(b) # ы Í, Í ШЕТ 2y) [dx da = 2 


: a] dedy = 


f. al » 2 5 dvd 7 
© e ГД ja = y 
— Sox жу уу LADO. 18 
Entáo ox = Xi = m7 3) = e 


Então + 
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— t 1 2 1 
(e) XY = f. f x ern) as ay = 1 


— БЕ 1 Бузу = i. 

Entáo oxy = XY- XY = i-(9(3) | — 162 

i в = E PP — gos 
бубу У1З/162 V 28/824 


Note-se que o coeficiente de correlação linear é pequeno — o que é de se esperar, 
considerando-se as retas de regressão de mínimos quadrados obtidas no Problema 8.42. 


8.42. Escreva as retas de regressão de mínimos quadrados de (a) Y sobre X, (b) X 
sobre Y, para o Problema 8.40. 


(a) A reta de regressão de Y sobre X é 


> _ оху E ou -uief 5 
y Fu (6-53) c 5—18 = 33782 (= 5) 
(Б) A reta de regressão de X sobre Yé z-X (y—Y 
E O Pl aa ou 
> ы 5  -1162/ ш 
d der ME Жо mast 3) 


TEORIA AMOSTRAL DA REGRESSAO 


8.43. No Problema 8.11 obtivemos a equação y = 35,82 + 0,476 x de regressão de 
y sobre x. Ao nível de significância de 0,05, teste a hipótese de que o coefi- 
ciente de regressão da equação da população é de apenas 0,18. 


2 ESB _ QUO — 0,180 DS .. ig 
t= VA = Uamamgee O P 


pois sy, x = 1,28 (calculado no Probl. 8.22) e 8, = 2 = 2,06 pelo Probl. 8.11. 

Com base em um teste unilateral pela distribuição de Student ao nível de 0,05 
rejeitaríamos a hipótese de o coeficiente de regressão ser de apenas 0,18 so 1 >*g95 =1,81 
para 12 — 2= 10 graus de liberdade. Assim, não podemos rejeitar a hipótese. 


8.44. Determine limites de confiança de 95% para o coeficiente de regressão do 


Problema 8.43. 
PEN: ER 
gap a > 


Então, os limites de confiança de 95% para fj (obtidos fazendo-se t =ttagns = 12,23 


8.45. 


8.46. 
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para 12 — 2 = 10 graus de liberdade) são dados por 


2,28 
$ 
У10 


isto é, podemos ter 95% de confiança em que В esteja entre 0,136 e 0,186. 


28 


No Problema 8.11, determine limites de confianga de 95% para as alturas dos 
filhos cujos pais tenham altura de (а) 65 polegadas e (b) 70 polegadas. 


Сото [9,955 = 2,23 para 12 ~ 10 graus de liberdade, os limites de confiança 


de 9576 para ур são 


onde yg = 35,82 + 0,476 хо (Problema 8.11), sp x = 1,28, sx = 2,66 (Problema 8.43), 
en= 12. 


(а) Se xo = 65,0, yy = 66,76 polegadas. Também, 
(ко — £)? = (65,0 — 800/12)? = 2,78. 
Então, os limites de confiança de 95% são 


2 


pas. 
! (1,8) y 12411 122,8) —.— 66,76 = 3,80 pols. 


06,76 + 
5 (2,66)? 


vio 
ie., podemos ter cerca de 95% de confiança em que as alturas dos filhos estejam 
entre 63,0 e 70,6 polegadas. 


(b) Se xp =70,0, Yo =69,14 polegadas. Também, (xo — 3X)? =(70,0 — 800/12? =11,11 


Então, os limites de confiança são 69,14 + 5,09 polegadas, isto é, podemos ter cerca 
de 95% de confiança em que as alturas dos filhos estejam entre 64,1 e 74,2 polegadas, 

Note-se que, para grandes valores de т, os limites de confiança de 95 %são dados 
aproximadamente por yo + 1,96 sy,x ou yg + 2sy x desde que ag — Z пао seja 
muito grande. Isto está de acordo com os resultados aproximados mencionados na 
página 375, Os métodos deste problema são válidos independentemente do tamanho 
de n ou zg— Ӯ, ie., os métodos amostrais são exatos para uma população normal, 


No Problema 8.11, determine limites de confiança de 95% para as alturas 
médias dos filhos cujos pais tenham altura de (2) 65,0 e (b) 70,0 polegadas. 


Como t9975 = 2,23 para 10 graus de liberdade, os limites de confiança de 95% 
para Y, são 


onde yy = 35,82 +0,476 хо (Problema 8.11), sy.x = 2,66 (Problema 8.43). 


(а) Se х = 65,0, obtemos (compare com o Probl, 8.45(a)) os limites de confianca de 
95% 66,76 + 1,07 polegadas, isto é, podemos ter cerca de 95% de confiança cm que 
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a altura média de todos os filhos cujos pais tenham 65,0 polegadas de altura esteja 
entre 65,7 e 67,8 polegadas. 


(b)Se xg = 70,0 obtemos (compare com o Probl. 8.45(»)) os limites de confiança de 
95% 69,14 + 1,45 polegadas, isto é, podemos ter cerca de 95 %de confiança em que 
a altura média dos filhos cujos pais tenham 70,0 polegadas de altura esteja compreen- 
dida entre 67,7 e 70,6 polegadas. 


TEORIA AMOSTRAL DA CORRELAÇÃO 


8.47. Com base em uma amostra de tamanho 18 obteve-se um coeficiente de 
correlação de 0,32. Ao nível de significância de (2) 0,05, (b) 0,01, podemos 
concluir que o coeficiente de correlação da população correspondente seja 
significativamente maior do que zero? 


Desejamos decidir entre as hipóteses (Ho р 0) e (H:p>0). 
ry 032/1873 


vi 


(а) Сот base em um teste unilateral pela distribuição de Student ao nível de 0,05, 
rejeituríamos Ho se f2^fggs = 1.75 para 18 - 2= 16 graus de liberdade, Assim, 
não podemos rejeitar A, ao nível de 0,05. 


(5) Como não podemos rejeitar Ho ao nível de 0,05, certamente também não podemos 
rejeitá-la ao nível de 0,01. 


8.48. Qual o tamanho mínimo de amostra necessário para que possamos concluir 
que um coeficiente de correlação de 0,32 seja significativamente maior do que 
zero ao nível de 0,05? 


Ao nível de 0,05, com um teste unilateral de Student, o valor mínimo de n deve 
ser tal que 


032/n — 2 


= tops paran —2 graus de liberdade 


Para um número infinito de graus de liberdade, togs = 1,64 donde n = 25,6. 
Рша п — 26, v= 24, to9s=1,71, t = 0,82V24/V/1— (0,32)? = 1,65. 
Para m = 27, v = 25, tops = 1,71, # = 0,82 V/25/V/1 — (0,32)? = 1,69. 
Para п = 28, » = 26, toos = 1,71, t = 0,32V/26/V1— (0,322 = 1,72. 


8.49. 


(2) 


8.50. 


8.51. 
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Então o tamanho mínimo da amostra deye ser п = 28. 


Com base em uma amostra de tamanho 24 obteve-se um coeficiente de 
correlação r= 0,75. Ao nível de significância de 0,05, podemos rejeitar а 
hipótese de que o coeficiente de correlação da população seja (а) p = 0,60, 
(b)p=0,50? 


1 0/7: 1+0,60 
= pa рж = быз саз im 2 
Z=1,1513 log ( =07 0,9730, uy = 1,1513 log ( = a) 0,6932, 
1 
к= — = 0,2182 
zZ vai ^ 
A variável padronizada é então " 
@— ш 0,9730 — 0,6932 _ ,, 
gs cgo e мА. 


Ao nível de 0,05, com um teste unilateral pela distribuição normal, rejeitaríamos 
a hipótese somente se z fosse maior do que 1,64. Assim, pois, náo podemos rejeitar a 
hipótese de que o coeficiente de correlação da população seja de 0,60. 


(b)Se р = 0,50, uz = 1,1513 log 3 = 0,5493 е 
z — (0,9730 — 0,5493)/0,2182 — 1,94. Assim, podemos rejeitar a hipótese de que o 
coeficiente de correlação da população seja de apenas 0,50, ao nível de significância 
de 0,05. 


O coeficiente de correlação entre as notas finais de física e matemática de um 
grupo de 21 estudantes é 0,80. Determine limites de confiança de 95% para 


este coeficiente. 


Como г = 0,80 e n= 21, os limites de confiança de 95% para iz são dados por 
1 


ef: 
2 t 1,96 0, = 1,1513 log LU * 1,96 = 1,0986 + 0,4620 


Então ¡uz tem o intervalo de confiança de 95%de 0,5366 a 1,5606. 


BE de 1,1513 108 y e) = 0,5366, p = 0,4904. 


Se E 1513 og (1-5) = 1,5606, p = 0,9155. 


Assim, pois, os limites de confiança de 95% para р são 0,49 e 0,92. 


Os coeficientes de correlação para duas amostras de tamanhos 1, = 28 e 
ny= 35 são, respectivamente, r, = 0,50 e r, = 0,30. Há diferença significa- 
tiva entre os dois coeficientes, ao nível de 0,05? 


k 
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" 
3 = 0,3095 
2 


1-7 fi 
Z, = 11518106 1—52) = 0,5493, Zo = 1,1513 log y = 
: = 


0,2669 


Desejamos decidir entre as hipóteses (Ho: ии = 47) € (CATA 
Sob a hipótese Ho. 


_ ZiZa (ава) _ 0,5498 — 080950 . 0,8985 


922, 0,2669 
Com um teste unilateral pela distribuição normal, rejeitaríamos Hg, somente se 
z > 1,96 ou z < -1,96. Assim, pois, não podemos rejeitar Hg e concluímos que os 
resultados não são significativamente diferentes ao nível de 0,05. 


PROBLEMAS DIVERSOS 
8.52. Deduza a fórmula (25), pág. 375. 


Para a reta de mínimos quadrados temos (Problemas 8.20 e 8.21) 


Z- 0)? Ela YY) 
2 = e E em 2 
$us = т. b n 
Mas, por definigáo, 

X —49 . „ X(x—z(y-—-u) _ 

n 0 n 6 
e, por (6), pág. 372. 
b Х(0—#)(и— 9) — Say 
5 


Logo 


Fórmula análoga vale para a população (v. Problema 8.54). 


8.53. Prove que E((Y — Yy] = E[(Y — Y«)] + E((Y««— Yy] para о caso 
de (a) uma reta de mínimos quadrados e (b) uma parábola de mínimos 
quadrados. 


Temos PS = (EF) a) 
Então (PP = (Y YA? + (Vos PPA UY — Ves Y est — Y) 


е assim, 
EPP] = E(Y—YA] + ЕК. Ë) + 2E((Y — Yes) Yost Y)] 
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é zero. 


O resultado procurado decorre imediatamente, desde que provemos que o último termo 


(a) Para a regressão linear, Y yy, = а + ВХ. Então 
EY — Yes Fos— Y)] 


E((Y —a— ВХ) + 8X— Y)] 

= (a— Y)E(Y —a— ВХ) + BE(XY — aX — ВХ?) 
=0 

em virtude das equações normais 


Е(Ү—«—В8Х) = 0, E(XY—oX – ВХ?) = 0 
(Compare com o Problema 8.3) 
(b) Para a regressão parabólica, У... = a + ВХ + yX?. Então, 

ERY - У.) —Y) = ЕЦ – а – ВХ – УХ) (а pX + yX* — E 


(«— Y)E(Y — a — ВХ — X2) + BE[X(Y — a — ВХ — yX3)] 
+ yE[XAY —a— BX 
= 0 


20) 
em virtude das equações normais 


E(Y — a — ВХ — YX?) 


0, E[X(Y—a—gX yX) = 0, 
E[XXY —a— AX —yX3] = 0 


Compare com as equações (19), pág. 374. 


O resultado pode ser estendido a curva de mínimos quadrados de grau supetior. 
8.54. Prove que су y 


= o$(1— р?) para a regressão de mínimos quadrados. 


Pela definição de coeficiente de correlação generalizado р, juntamente com o 
Problema 8.53, temos, tanto para o caso linear como para о caso parabólico, 
EO T 

2 a 

p 


E E 
- = 1 
Ejir- T) 


"m 
] EQY- 
e o resultado procurado decorre imediatamente. 


zo se 1 
TP 


A relagío vale também para curvas de mínimos quadrados de grau superior. 


8.55. Mostre que, no caso de regressão linear, o coeficiente de regressáo, tal como 
definido por (45), se reduz ao definido por (40) 


O quadrado de coeficiente de correlação. ou seja, o coeficiente de determinação, 
tal como dado por (45), é, no caso da regressão Ivar, dado рог 


a) 


_ Elle+gx- 7) 


z 
“y 
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Mas como Y = «+ ВЖ, 


(2) Ele +X- Ë] = E(exx—2Xy) = PAX] 
= TEE 
= qa TX с a 
Então (1) se toma 
9х ?xy 
(3) = ош p= 
sie OL Oy 


como queríamos demonstrar. (O sinal correto de p já está implícito em exy-) 


8.56. Com referência à Tábua 8-21, (a) determine uma parábola de regressão de 
mínimos quadrados que se ajuste aos dados. (b) Calcule os valores de regressão 
(comumente chamados valores de tendência) para os anos dados e compare-os 
com os valores observados. (c) Estime a população para 1 945. (d) Estime a 
população para 1 960 e compare com o valor observado, 179,3. (e) Estime a 
população em 1 840 e compare com o valor observado, 17,1. 


Tábua 8-21 
1850 1860 | m 1890 |1900 |1910 |1920 |1930 [1940 |1950 
População dos 
EE.UU. 23,2 | 31,4 | 39,8 | 50,2] 62,9 | 76,0 | 92,0 | 105,7 122,8|131,7 |1511 
(milhóes) 


Fonte: Divisão do Censo. 


(a) Denotemos por x e y, respectivamente, o ano e a população durante o ano. À 
equação de uma parábola de mínimos quadrados que se ajuste aos dados é 


(0) у = а += + сай 
onde a, b e e são obtidos das equações normais 
(2) Зу = ап + bEr + cla? 


Sey = «Зх + Ьа? + oxi? 
Soy = aba? + Ь®х% + Ee 
É conveniente locar a origem de modo que o ano médio, 1 900, corresponda a 
x = 0, e escolher uma unidade que faça com que os anos 1 910,1 920, 1 930, 1 940, 
1950 e 1890, 1880, 1870, 1860, 1850 correspondam a 1, 2, 3, 4,5 ea -1,-2, 
-3, -4, —5, respectivamente. Com esta escolha Хх e Ex? são nulos e as equações (2) 
se simplificam. 
O trabalho de cálculo pode ser disposto como na Tábua 8-22. As equações 
normais (2) se escrevem 
(3) 11а + 110с = 886,8 


110b = 1429,8 
1100 + 1958с = 9209,0 
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Da segunda equação em (3), b= 13,00: das primeira a terceira equações, 
а= 76,64, c = 0,3974. Então, a equação procurada é 
(4) у = 16,64 + 13,00 4 + 0,8974 22 
onde a origem, x = 0, é 1 de julho de 1 900 e a unidade x é 10 anos. 


Tábua 8-22 


(b)A Tábua 8-23 dá os valores de tendência obtidos mediante substituição de x = —5, 


—4, —3, —2, —1, 0, 1, 2, 3, 4, 5 em (4), juntamente com os valores observados. Vé-se 
que há boa concordáncia. 


Tábua 8-23 


xz-5|x-4|x--3 х=2 |x=3 
Ano 1860 | 1870 1930 
Valor de 
tendência 31,0 | 41,2 104,2] 119,2 
Valor | 
observado| 23,2 | 31,4 | 39,8 | 50,2 | 62,9 | 76,0 | 92,0 | 105,7| 1228 


(c) 1 945 corresponde a x = 4,5, рага o qual 


y = 76,64 + 13,00(4.5) + 0,3974(4,5)2 = 143,2. 
(d) 1 960 corresponde ax = 6, para o qual 


y = 16,64 + 18,00(6) + 0,8974(6)2 = 168,9. 
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Este valor não concorda muito bem com o valor observado, 179,3. 
(е) 1 840 corresponde a x = —6, para o qual 
y = 76,64 + 13,006) + 0,3974(—6)? = 12,9. 
* resultado que não concorda com o valor observado 17,1. 
Este exemplo ilustra o fato que uma relação válida para determinado âmbito de 
valores não é necessariamente válida para um âmbito maior. 


8.57. A Tábua 8-24 dá os preços médios das ações c títulos divulgados pela Bolsa 
de Nova York nos anos de 1950 a 1 959. (a) Determine o coeficiente de 
correlação e (b) Interprete os resultados. 


Tábua 8-24 


Ano 1950 [1951 1952 |1953 [1954 


Prego médio 
de ações 35,22 


39,87 | 41,85 | 43,23 | 40,06 | 53,29 49,12 | 40,71 


100,93 | 97,43 | 97,81 | 98,32 100,07 | 97,08 |9159 m 94,65 
ма im 


Fonte: New York Stock Exchange, 


Preço médio 


de títulos [102,43 


(a) Denotando por x e y os preços médios de ações e de títulos, os cálculos do coeficien- 
te de correlação podem dispor-se como na Tábua 8-25. Note-se que o ano é utilizado 
unicamente para especificar os correspondentes valores de x c y. 


Tábua 8-25 — 
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Então, pela fórmula de momento-produto 
Seu! esi 
= Day = 200 = 0,4614 
КЕКЕТЕ y (449,88)(93,69) 
(b) Concluímos que existe certa correlação negativa entre os preços de ações e os de 


títulos (i,e., uma tendência de baixa nos preços de ações quando se verifica alta nos 
preços de títulos, e vice-versa), muito embora tal relacionamento não seja acentuado. 


Outro Método. 


A Tábua 8-26 dá os postos dos preços médios de ações e de títulos para os anos de 
1950 e 1959, por ordem crescente de preço. A Tábua dá também as diferenças d de 


postos, e 27? 
Tábua 8-26 
1 Ano 1950 | 1951 | 1952 | 1953 | 1954 | 1955 | 1956 1957 | 1958 155] 
т" "T 
Preços de ações p/ il 2 " 6 3 8 " ió 
ordem de posto | 
“Preços de títulos | = E 
p/ ordem de 10 | 9/5|6 JE 4 2 
ea | 
Rasa e ||| | 4 [о 5 8 
ы | 
| Р Le 
Ф 8| 49| 0 0 16 | 0 | 25 64 
Entáo, 
r 63d? 6(272) 
aU Es de ex A ll oc 
А aê —1) 1- oao- i cid 


O resultado concorda satisfatoriamente com o resultado do primeiro método. 


8.58. A Tábua 8-27 dá as distribuições de frequência das notas finais de 100 estu- 
dantes em matemática e física, Determine (a) o número de estudantes que 
obtiveram notas 70-79 em matemática e 80-89 em física, (b) a percentagem 
de estudantes com notas em matemática abaixo de 70, (c) o número de estu- 
dantes que obtiveram 70 ou mais em física e menos de 80 em matemática, 
(d) a percentagem de estudantes que passaram pelo menos em uma das disci- 
plinas (admitindo 60 como mínimo para aprovação). 


422 PROBABILIDADE E ESTATÍSTICA 


Tábua 8-27 
NOTAS DE MATEMÁTICA 


60-69 | 70—79 


NOTAS DE FISICA 


TOTAIS 


NOTAS EM 
FÍSICA 


(a) Percorra a coluna encimada por 70-79 (nota em matemática) até a linha 80-89 
(nota em física). O valor 4 é o número de estudantes procurado. 


(b) Total de estudantes com nota em matemática inferior a 70 = (nº com nota 40-49) + 
+ (n9 com nota 50-59) + (n9 com nota 60-69) = 7 +15 +25 = 47. 
Percentagem de estudantes com notas em matemática abaixo de 70 = 47/100 =47%. 


(c) O número procurado de estudantes é o total das entradas da Tabela 8-28, que é parte 
da Tábua 8-27. 
Esse número é 1 +5 +2 +4 +10 =22. 


Tábua 8-28 Tábua 8-29 
NOTAS EM NOTAS EM 
MATEMÁTICA MATEMÁTICA 


NOTAS EM 
FISICA 


(d) Referindo-nos à Tábua 8-29, que é parte da Tábua 8-27, vemos que o número de estu- 
dantes com nota inferior a 60 tanto em matemática como em física é 
3+3+6+5= 17. 
Então, o número de estudantes com nota igual ou superior a 60 em matemática ou 
física é 100 — 17 = 83, e a percentagem correspondente é 83/100 = 83%. А Tábua 
8-27 costuma chamar-se tábua de freqtiéncia bivariada ou distribuição de frequência 
bivariada. Cada retângulo é uma célula e corresponde a um par de classes ou interva- 
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los de classe. O número ali indicado é a fregüéncia da célula. Por exemplo, na parte 
(a) o número 4 é a frequência da célula correspondente ao par de intervalos de 
classe 70-79 para matemática e 80—89 para física. 

Os totais indicados na última linha e na última coluna são os totais marginais ou 
freqüéneias marginais. Correspondem, respectivamente, ás freqüéncias das classes 
das distribuições — separadas — de notas de matemática e notas de física. 


8.59, Mostre como se deve modificar a fórmula do Problema 8.31 para o caso de 
dados grupados como na Tábua 8-27. 


Para dados grupados, podemos considerar os diversos valores das variáveis x e y 
como coincidentes com os pontos médios das classes, enquanto que fy e fy são as fre- 
qüéncias de classe ou freqüéncias marginais correspondentes indicadas na última linha 
e na última coluna da tábua de fregiiência bivariada. Se f representa as diversás fregijén- 
cias de células correspondentes aos pares de pontos médios (x, y), então podemos 
substituir a fórmula do Problema 8.31 por 
а) 3 nZjey — ALÍ) 


V[nXf,«? — (3f, a9] [n3 f v? — (Xf, uY] 

Fazendo x = £y + CU, ё Y = yo + сүн, Onde cy e су são as amplitudes dos 
intervalos de classe (supostas constantes) e x, e y são pontos médios arbitrários corres- 
pondentes às variáveis, a fórmula acima se escreve 
(2) NÈ furty — (Efi) fy tty) 


Vinti — (fru [на — fuut] 
É o mesmo método abreviado utilizado no Capítulo 5 para cálculo de médias, 
desvios padrões e momentos de ordem superior, 


8.60. Determine o coeficiente de correlação linear das notas de matemática e de 
fisica do Problema 8.58. 


Utilizaremos a fórmula (2) do Problema 8.59. O trabalho pode dispor-se como 
na Tábua 8-30 > chamada tabela de correlação. 


O número no canto de cada célula representa o produto fuxuy, onde f é a fre- 
qüéncia da célula. A soma de tais números em cada linha acha-se indicada na linha 
correspondente da última coluna. E a soma de tais números em cada coluna acha-se 
indicada na coluna correspondente da última linha. Os totais finais da última linha e da 
última coluna são iguais e representam Zfuxuy. 

Da Tábua 8-30 temos 


nXfu,u,— Ef Ey uy) 


V[nf.u2 — (Sf. ug? [nS f ug (Efyuy)?] 
|. Q100Y125) — (64)(—55) Е 16.020 | "-— 
v[(100)(236) — (64)? [(100)(253) — (—55)8] V(19,504)(22,275) i 
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Tábua 8-30 


Notas de Matemática, = 


T pm 

Soma 

E 
u uz | números 
fu һы М посато 
de cada 

linha 

10 20 40 | 44 


Notas de Física, y 


Soma dos 

nümeros do 
canto de 

cada coluna | 


8.61. Use a tabela de Correlação do Problema 8.60 para calcular (a) sy, (b) sy е 
(с) Syy е verifique a fórmula 7 =Sxy/SxS y: 


e [31,2 e 


n n 


b fa i 
Ф) ае MELEE — 
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| o eee ey 


125 / 64 M —85V] _ 
= (10)00) us (а) = 160,20 


Assim, os desvios padróes das notas de matemática e das notas de física sáo, 
respectivamente, 14,0 e 14,9, enquanto sua covariância é 160,2. Temos 


Sm 10020 _ 
ss, BIE = 07686 


o que concorda com o valor de r obtido no Problema 8.60. 


8.62. Escreva as equações das retas de regressão (a) de y sobre x e (b) de x sobre y 
para os dados do Problema 8.60. 


Da Tábua 8-30 temos 


Zf.u. B 

й = are A = в45 + SECA = 0,9 
хўи T 

ӯ vo ta = ТАБ + gotas) = 69,0 


Dos resultados do Problema 8.61, sy = 13,966, sy = 14,925 er = 0,7686. 
Utilizamos agora (16), pág. 374, para obter as equações das retas de regressão. 


" a (0,7686)(14,925) 
"e = C — PPP pis 
(a) y — y - 69,0 15,966 (= — 70,9), 
ou 69,0 = 0,821(x — 70.9) 
E son — (0,7686)(13,966 А 
(b) r-gc- æ — 70,0 = a y — 69,0), 
ou 


= 70.9 0,719(y — 69,0) 
8.63. Calcule os erros padrões de estimativa (a) Sy.x e (b) Sx.y para os dados do 


Problema 8.60. Use os resultados do Problema 8.61. 


(а) уа = s,Vi— rà = 14925V1-— (0,7686)? = 9,548 


(b) ssy = s,Vi—7? = 13,966/1— (0,1686)? = 8,934 
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Problemas Suplementares 


A RETA DE MINIMOS QUADRADOS 


8.64. Ajuste uma reta de mínimos quadrados aos dados da Tábua 8-31 tomando (а) x como 
variável independente, (b) x como variável dependente. Faça os gráficos dos dados e das 
retas utilizando o mesmo sistema de coordenadas. 


Tábua 8-31 


8.65. Para os dados do Problema 8.64 determine (а) os valores de y para х= 5 e x= 12, 
(b) o valor de x quando y = 7. 


8.66. (a) Use o método de mão livre para obter a equação de uma reta que se ajuste aos dados 
do Problema 8.64. (b) Responda ao Problema 8.65 usando o resultado da parte (п). 


8.67. A Tábua 8-32 dá as notas finais em álgebra e física de 10 alunos escolhidos ao acaso 
dentre um grande grupo de alunos. (a) Faça o gráfico dos dados. (b) Determine a reta de 
mínimos quadrados que se ajuste aos dados, tomando x como variável independente. 
(c) Determine a reta de mínimos quadrados para os mesmos dados, tomando y como 
variável independente. (d) Se um aluno tira 75 em álgebra, qual a sua nota esperada em 
física? (e) Se um aluno tira 95 em física, qual a sua nota esperada em álgebra? 


Tábua 8-32 


Álgebra (x) 


Física (у) 


8.68. Com referéncia à Tábua 8-33, (a) construa um diagrama de dispersáo. (5) Determine a 
reta de regressão de mínimos quadrados de y sobre x. (c) Determine a reta de regressão 
de x sobre y. (d) Faça o gráfico das duas retas (b) e (c) sobre o diagrama de dispersão 


de (a). 
Tábua 8-33 
Nota no 19 Teste (x) 6 5 8 8 7 6 10 
Nota no 29 Teste (m | 8 т 7 10 5 8 10 


CURVAS DE REGRESSÃO DE MINIMOS QUADRADOS 


8.69. Ajuste uma parábola de mínimos quadrados, у = а + bx + cx?, aos dados da 
Tábua 8.34. 
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Tábua 8-34 


8.70. A Tábua 8-35 dá a distância de parada d (pés) de um automóvel que está correndo a 
velocidade v (milhas p/hora) a partir do momento em que avista um perigo. (a) Faça o 
gráfico de d em função de v. (b) Ajuste aos dados uma parábola de mínimos quadrados 
da forma d = a+ bv + cv? (c) Estime d para у = 45 milhas p/hora e v = 80 milhas 
p/hora. 


Tábua 8-35 


Velocidade у (milhas/h) 


Distáncia de parada d (ft) 


8.71. A Tábua 8-36 dá o número y de bactérias por unidade de volume presentes em uma 
cultura ao cabo de x horas. (a) Faga o gráfico dos dados em papel semi-logarítmico, 
com escala logarítmica para y e escala aritmética para x. (b) Ajuste uma curva de míni- 
mos quadrados da forma y —ab" aos dados e explique por que esta equação deve dar 
bons resultados. (c) Compare os valores de y assim obtidos com os valores observados. 
(d) Estime o valor de y рата x 77. 


Tábua 8-36 
Nümero de horas (x) 0 ba 2 3 4 5 6 
Número de bactérias p/unid. volume (y) 32 ал 65 92 132 190 275 


8.72. No Problema 8.71, mostre como se pode utilizar o papel semi-logarítmico para obter a 
equação procurada sem apelar para O método dos mínimos quadrados. 


8.73. Escreva as equações normais de mínimos quadrados para a curva dada por 
y = a+ ba + са? + das. 
REGRESSÃO MÚLTIPLA 


8.74. А Tábua 8-37 dá os valores correspondentes de três variáveis x, y, 2. (4) Determine а 
equação de regressão linear de z sobre x e y. (b) Estime z para x=10 ey =6. 


Tábua 8-37 
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8.75. Prove que a equação de regressão lincar de z sobre x e y pode escrever-se como 
2-2 = a(z—&) + b(y—d) 
e obtenha expressões para os coeficientes de regressão de mínimos quadrados, а e b. 


8.76. Use o resultado do Problema 8.75 para fazer o Problema 8.74. 


8.77. Obtenha as equações normais de regressão linear (mínimos quadrados) de w sobre x, 
ye 2. Qual a interpretação geométrica? Explique. 


8.78. Uma superfície de regressão de z sobre x e y tem a forma 
2 = А + Ве + Су + Dx? + Езу + Fy? 
Deduza as equações normais para os coeficientes de regressão de mínimos quadrados. 


ERRO PADRÁO DA ESTIMATIVA E 
COEFICIENTE DE CORRELAÇÃO LINEAR 


8.79. Determine (a) зух € (b) Sx y para os dados do Problema 8.68. 


8.80. Calcule (a) a variação total de y, (b) a variação não-explicada de y e (c) a variação expli- 
cada de y para os dados do Problema 8.68. 


8.81. Use os resultados do Problema 8.80 para determinar o coeficiente de correlação entre os 
dois conjuntos de dados do Problema 8.68 


8.82. (a) Determine o coeficiente de correlação entre os dois conjuntos de notas do Problema 
8.68 utilizando a fórmula do momento-produto e compare com o resultado do Problema 
8.81. (b) Obtenha o coeficiente de correlação diretamente dos coeficientes angulares das 
retas de regressão dos Problemas 8.68 (b) e (c). 


8.83. Determine a covariáncia para os dados do Problema 8.68 (a) diretamente e (b) usando a 
fórmula syy =rsxSy e o resultado do Problema 8.81 ou do Problema 8.82. 


8.84. A Tábua 8-38 dá a idade x e a pressão sistólica y para um grupo de 12 mulheres. (a) De- 
termine o coeficiente de correlação entre x e y. (b) Determine a reta de regressão de 
mínimos quadrados de y sobre x. (c) Estime a pressão de uma mulher de 45 anos. 


Tábua 8-38 


Idade (x) Е 42 72 36 63 47 55 49 38 42 68 60 


Pressão (y) 147 125 160 118 149 128 150 145 115 140 152 155 


8.85. Determine o coeficiente de correlação para os dados (4) do Problema 8.64, (b) do 
Problema 8.67. 


8.86. O coeficiente de correlação entre duas variáveis x e y ér =0,60. Se sx = 1,50, sy = 2,00, 
х= 10 e y = 20, determine as equações das retas de regressão de (a) y sobre x, (b) x 
sobre y. 


8.87. Calcule (а) sy, x e (b) sx, y para os dados do Problema 8.86. 


8.88, 


8.89. 


8.90. 
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Sesyx=38sy= 5 determine r. 


Se o coeficiente de correlação entre x € Y é 0,50, que percentagem da variação total 
permanece não-explicada pela equação de regressão? 


(a) Calcule o coeficiente de correlação entre os valores correspondentes de x e y na 
Tábua 8-39. (b) Multiplique cada valor de x da Tábua por 2 e some 6. Multiplique 
cada valor y da tábua por 3 e subtraia 15. Determine o coeficiente de correlação entre 
os dois novos conjuntos de valores, explicando por que obteve (ou não obteve) o mesmo 
valor da parte (a). 


Tábua 8-39 


18 12 10 8 


COEFICIENTE DE CORRELAÇÃO GENERALIZADO 


8.91, 


8.92. 


8.93. 


8.94. 


Determine o coeficiente de correlação para as variáveis do Problema 8.68 usando o 
resultado (35), página 378. 


Determine o erro padrão da estimativa de z sobre x e y para os dados do Probl. 8,74. 


(a) Calcule o coeficiente de correlação múltipla para os dados do Problema 8.74. (b) Que 
percentagem da variação total é explicada pela superfície de regressão? 


Prove o resultado (27), página 376, para o caso de uma superfície de regressão linear 
para z sobre x e y. 


CORRELACÁO DE POSTOS 


8.95. 


Dois juízes de um concurso, solicitados a classificar 8 candidatos A, B, C, D, E, Е, Ge H 
por ordem de suas preferéncias, fizeram as escolhas constantes da Tábua 8.40. Determine 
o coeficiente de correlação de postos € decida quanto á concordáncia entre os julgamen- 
tos dos dois juízes. 


Tábua 8-40 
Candidato A B C D EF G H 
19 Juiz | 5 2 8 1 4 | 6 8 7 
29 Juiz à 5 7 8 2 8 Е 1 б 


8.96. Determine o coeficiente de correlação de postos para os dados (a) do Problema 8.68, 


(b) do Problema 8.84. 
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8.97. (a) Determine o coeficiente de correlação de postos para os dados do Problema 8.90. 
(b) De sua observação quanto a (a), discuta uma possível desvantagem do método da 
correlação de postos. 


8.98. Mostre como estabelecer um coeficiente de correlação múltipla de postos. 


INTERPRETAÇÃO PROBABILISTICA 
DA CORRELAÇÃO E REGRESSAO 


8.99. A função de densidade conjunta das variáveis aleatórias X e Y é 


[23 + 3y 0x1 bagya 
fe» = jo em caso contrário 


Determine a curva de regressáo de (a) Y sobre X, (b) X sobre Y. 


8.100. Determine a reta de regressáo de mínimos quadrados de (a) Y sobre X, (b) X sobre Y, pa- 
ra o Problema 8.99. 


8.101. Obtenha o coeficiente de correlação linear para o Proklema 8.99. 


8.102. Determine a curva de regressão de (а) Y sobre X, (b) X sobre Y para os dados do Proble- 
ma 2.8, página 71. 


8.103. Determine a reta de regressão de mínimos quadrados de (4) Y sobre X, (b) X sobre Y 
para os dados do Problema 2.8, página 71. 


8.104. Determine o coeficiente de correlação linear para as variáveis aleatórias do Problema 
2.8, pág. 71. 


8.105. Dé um exemplo para mostrar como determinaria (а) o erro padrão da estimativa, (b) as 
variações explicada e não-explicada, (c) o coeficiente de correlação generalizado, no caso 
de duas variáveis aleatórias X e Y com função de densidade conjunta (ou função de 
probabilidade conjunta) f(x, y). 


8.106.No caso de as variáveis X e Y serem independentes, ocorre alguma simplificação nas 
curvas de regressão de Y sobre X e de X sobre Y? Explique. 


TEORIA AMOSTRAL DA REGRESSÃO 


8.107. Com base em uma amostra de tamanho 27, obteve-se a equação de regressão de y sobre x 
y = 25,0 1 2,002. Se sy. = 1,50, в, = 3,00 e? = 7,50,determine limites de con- 
fiança (a) de 95% (b) de 99% para o coeficiente de regressão. 


8.108.No Problema 8.107, teste, ao nível de significância de 0,01, a hipótese de que o coefi- 
ciente de regressão da população seja (a) 1,70, (b) 2,20. 


8.109. No Problema 8.107, determine limites de confiança (a) de 95% (p) de 99% para y 
quando x = 6,00. 
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8.110.No Problema 8.107, determine limites de confiança (a) de 95% , (b) de 99% para a 
média de todos os valores de y correspondentes a x = 6,00. 


8.111.Com referência ao Problema 8 84, determine limites de confiança de 95% para (a) o 
coeficiente de regressão de y sobre x, (b) as pressões de todas as mulheres de 45 anos, 
(c) a média das pressões de todas as mulheres de 45 anos. 


TEORIA AMOSTRAL DA CORRELAÇÃO 


8.112.0 coeficiente de correlação baseado em uma amostra de tamanho 27 é 0,40. Podemos 
concluir, ao nível de significância (a) de 0,05, (b) de 0,01 que o coeficiente de correlação 
da роришейб correspondente seja significativamente maior do que zero? 


8.113.0 coeficiente de correlação baseado em uma amostra de tamanho 35 é 0,50. Podemos 
rejeitar a hipótese de que o coeficiente de correlação da população seja (а) О = 0,30, 
(b) p= 0,70, ao nível de significância de 0,05 ? 


8.114. Determine limites de confiança (a) de 95%, (b) de 99% para um coeficiente de correla- 
ção de 0,60 calculado com base em uma amostra de tamanho 28. 


8.115. Faça o Problema 8.114 se o tamanho da amostra é 52, 


8.116. Determine limites de confiança de 95% para o coeficiente de correlação calculado no 
Problema 8 84. * 


8.117. Dois coeficientes de correlação, obtidos com base em amostras de tamanho 23 e 28, são 
0,80 e 0,95, respectivamente. Podemos concluir, ao nível de significância de (a) 0,05, 
(b) 0,01, que haja diferença significativa entre os dois coeficientes? 


RESULTADOS DIVERSOS 
8.118. Verifique os coeficientes (5), página 372, para a reta de mínimos quadrados. 


8.119.Prove que, no caso da regressão linear, o valor mínimo de E([Y — (a + X)|”) é 
пу = e: — p?) 
8.120. As retas de mínimos quadrados de regressáo amostral para um conjunto de dados envol- 
vendo as variáveis X e Y são 2x —5y = 3, 5x — Ву = 2. Determine o coeficiente de 
correlação linear. 


8.121. Prove que o ângulo entre as duas retas de regressão amostral de mínimos quadrados ê 
dado por 
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8.123. Prove que o coeficiente de correlação é independente da escolha da origem das variáveis 
ou das unidades em que elas se exprimem. (Sugestão: Faça х? = xq +сүх, у' yo +С), 
onde Xo, yo, Cy, су São constantes arbitrárias, e prove que o coeficiente de correlação 
entre x' e p'é o mesmo que entre x e y.) 


8.124. Prove que, no caso de regressão linear, 


O resultado é válido também no caso de regressão não-linear? 


8.125. Determine a correlação entre a altura e o peso de 300 adultos do sexo masculino nos 
Estados Unidos, dados pela seguinte tábua. 


Tábua 8-4] 
ALTURAS x (pols.) 


63-66 


90—109 


110—129 


g| owe E 5 : mE E 

= 

~ | 150-169 2 | as 63 19 | 5 

a 

а |— E 

2 | 170-189 7 28 323 | 1% 

а T 
190—209 2 10 | 20 7 
210—229 | 1 4 2 


8.126. (a) Determine a reta de regressão de mínimos quadrados de y sobre x para o Problema 
8.125. (b) Estime o peso de dois homens cujas alturas são 64 e 72 polegadas, respecti- 
vamente. 


8,127, Determine (a) Sy.x € (b) sx. y para os dados do Problema 8.125, 


Tábua 8-42 


1950 | 1951 1952 | 1953 | 1954 | 1955 | 1956 


1145 | 116,2 


o consumo) 101,8 | 1028 |111,0 | 113,5 


Indice de 


preço no 


atacado 103,1 |1148 | 111,6 110,7 | 114,3 | 117,6 | 119,2 


Fonte: Bureau of Labor Statistics. 
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8.128. Determine limites de confiança de 95% para o coeficiente de correlação no Problema 
8.125. 


8.129. Determine o coeficiente de correlação entre os índices de preço para o consumidor e 
os índices de preço no atacado (EE.UU.) para todos os produtos, conforme exibidos na 
Tábua 8-42. Período base 1947-1949 = 100, 


8.130. Com referência à Tábua 8-43, (а) faça о gráfico dos dados. (b) Determine uma reta de 
mínimos quadrados que se ajuste aos dados e faça seu gráfico. (c) Calcule os valores de 
tendência e compare-os com os valores observados. (d) Estime o índice de preço para 
1958 e compare-o com o verdadeiro valor (144,4). (e) Em que ano podemos esperar que 
o índice de custo médico seja o dobro do índice do período 1947-1949, admitindo-se 
que permaneça a tendência atual? 


Tábua 8-43 


Ano 1950 1951 1952 1953 
аР ЕЕ 


Indice de prego 
para o consumidor 
(assist, médica) 
(1947-1949 = 100) | 106,0 | 111,1 117,2 121,3 


| Fonte: Burcau of Labor Statistics 


8.131.Com referência à Tábua 8-44, (a) faça o gráfico dos dados. (b) Determine uma parábola 
de mínimos quadrados que se ajuste aos dados. (c) Calcule os valores de tendência e 
compare-os com os valores observados. (d) Explique por que a equação obtida em (b) 
não setve para extrapolação. 


Tábua 8-44 


Ano 1915 | 1920 | 1925 | 1930 | 1935 | 1940 
Taxa de natalidade 
por 1.000 ` 25,0 | 23,7 


Fonte: Department of Health, Education and Welfare. 


21,3 | 18,9 | 16,9 | 17,9 


8.132. Sejam X e Y variáveis aleatórias com função de densidade corjunta (ou função de 
probabilidade) f(x, y). Prove que se g(x) = E(Y | X = х) então 
ЕҢҮ—(Х)?} = BUY — g(a?) + Et[g(X) — ¿any 
onde (x) é qualquer função de x para a qual essas esperanças existam. 


8.133. Discuta o relacionamento (se houver) do Problema 8.132 para com as variações explica- 
das e não-explicadas. 


8.134. Prove o Teorema 8-1, página 379, (Sugestão: Use o Problema 8.132.) 
8.135. No Teorema 8-1, g(x) é única? Justifique. 


8.136. Prove o Teorema 8-2, página 380. 


capítulo 9 


Análise da Variáncia 


OBJETIVO DA ANÁLISE DA VARIÂNCIA 


No Capítulo 7 utilizamos a teoria da amostragem para testar a significância de 
diferenças entre duas médias amostrais. Supusemos então que as duas populações 
— das quais se extraíram as amostras — tivessem a mesma variância. Em muitas 
situações, é preciso testar a significância de diferenças entre três ou mais médias 
amostrais, ou, equivalentemente, testar a hipótese de nulidade, de que as médias 
amostrais são todas iguais. 


EXEMPLO 9.1 Suponha-se que, em um experimento agricultural, quatro tratamentos químicos 
diferentes do solo tenham produzido safras médias de trigo de 28, 22, 18 e 24 bushels por are, 
respectivamente. Há diferença significativa entre essas médias, ou a dispersão observada é 
devida simplesmente ao acaso? 


Problemas cómo este podem ser resolvidos utilizando-se uma importante 
técnica conhecida como análise da variância, elaborada por Fisher. Tal técnica 
utiliza a distribuição F já aplicada em capítulos anteriores. 
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CLASSIFICAÇÃO DE UM CRITÉRIO 
OU EXPERIMENTOS DE UM FATOR 


Em um experimento de um fator, obtêm-se medidas ou observações para a 
grupos independentes de amostras, sendo b o número de medidas em cada grupo. 
Falamos então de a tratamentos, cada um dos quais tem b repetições ou réplicas. 
No Exemplo 9.1,a = 4. . 

Os resultados de um experimento de um fator podem ser apresentados em 
uma tábua com a linhas e b colunas (Tábua 9-1). Ali, хук denota o valor corres- 
pondente à ¡MA. linha e à KT? coluna, onde j= 1,2, ..., a, e k= 1,2,..., b. Por 
exemplo, хз; se refere ao 59 valor para O 39 tratamento. 


Tábua 9-1 
Tratamento 1 | % Tiz 8 
Tratamento 2 | Wop Taz La, 
La, 


Denotaremos por 2; a média das medidas na linha de ordem j. Temos 
a 1 А 
E, = р EUR O A (1) 


O ponto em 2; denota que se fez a somação em relação a К. Os valores %; chamam- 
se médias de grupo, médias de tratamento ou médias de linhas. A média geral é a 
média de todas as medidas em todos os grupos, e se denota por Z,i.e., 


= 05 De (2) 


Dri ао ja к 


VARIAÇÃO TOTAL, VARIAÇÃO INTERIOR AOS TRATAMENTOS, 
VARIAÇÃO ENTRE OS TRATAMENTOS 


Definimos a variação total, denotada por v, como a soma dos quadrados dos 
desvios de cada medida em relação à média global, isto é, 


Variação total = y = У (xk— 4) (3) 


Lk 
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Escrevendo a identidade 


Ln — = (Ue — Ej.) + (0. — E) (4) 
elevando ao quadrado e somando em relação a j e k, podemos mostrar (v. Problema 
9.1) que Y (2—2) = Y (0—21) + 2 (da 2) (5) 

ik » jk 
es ® (ena? = У (0а 01) +b E (5,2) (6) 
E Lk j 


Chamamos o primeiro somatório à direita de (5) ou de (6) variação interior aos 
tratamentos (pois envolve os quadrados dos desvios de хуу, a contar das médias x; , 


dos tratamentos),e denotamo-lo por э». Assim, 
V = p (za — ey (7) 
O segundo somatório à direita de (5) ou (6) é chamado variação entre os tratamen- 


tos (pois envolve os quadrados dos desvios das diversas médias £; dos tratamentos 
a contar da média geral @) e se denota por vp. Assim 


vw = Y (5-2? = d Y (5-2) (8) 
к E 
As equações (5) ou (6) podem então escrever-se 
V = Ф +2 (9) 


MÉTODOS ABREVIADOS PARA 
DETERMINAÇÃO DE VARIAÇÕES 


Para reduzir o trabalho de cálculo das variações acima, são úteis as seguintes 
fórmulas: 


2 as 
® = p Li — qb (10) 
1 , 2 
т = 24- (11) 
Vo = V — 0 (12) 


onde т é o total de todos os valores de хук e 7j. é o total de todos os valores no 
tratamento de ordem j, isto é, 


r= Y In т, = Y хк (13) 
ik k 


Na prática, é conveniente subtrair determinado valor fixo de todos os dados da 
Tábua. Isto não altera os resultados finais. 
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MODELO MATEMÁTICO LINEAR 
PARA A ANÁLISE DA VARIÂNCIA 


Podemos considerar cada linha da Tábua 9-1 como representando uma 
amostra aleatória de tamanho b da população, para aquele tratamento em particu- 
lar. Assim, para o tratamento /, temos as variáveis aleatórias independentes, identi- 
camente distribuídas, Хи, Хә, ..., Хь que tomam, respectivamente, оѕ 
valores 231, Uj2, » «+» Tj». Cada uma das Хук (k= 1, 2, ...,b) pode expressar-se 
como a soma de seu valor esperado e um termo correspondente ao “acaso”, ou 
“aro”, | 

Xy = bt Am (14) 
Os Aj, podem ser considerados como variáveis aleatórias independentes (em relação 
aj assim como a k), normalmente distribuídas com média zero e variância 02. Isto 
equivale a supor os Хук (j = 1,2, ...,4; k=1,2,..., b) variáveis normais, 
mutuamente independentes, com médias ду e a variância comum g. 
Definamos a constante и por 


1 
= т > "y 
podemos encarar | como а média de uma espécie de população global que englobe 
todas as populações de tratamentos. Então, (14) pode escrever-se como (v. Proble- 
9.18 
MOD E onde у= (15) 


dk 
A constante oj pode ser encarada como o efeito especial do PUO- tratamento. 
A hipótese de nulidade, de que todas as médias de tratamento sejam iguais, é 
dada por (Ho: а; = 0;7= 1,2,.. .,2) ou equivalentemente рог (Ho: p; = p; 
DEL ace n ` 
Se Ho é verdadeira, as populações de tratamento — que, por hipótese, são normais 
— têm uma média comum, e também uma variância comum. Assim, há na realidade, 
apenas uma população, e todos os tratamentos são estatisticamente idênticos. 


VALORES ESPERADOS DAS VARIAÇÕES 


A variação Vp, entre os tratamentos, a variação V, interior os tratamentos, e 
a variação total V são variáveis aleatórias que tomam, respectivamente, os valores 
vb, Pw e » tais como definidos em (8), (7) e (3). Pode-se mostrar (Problema 9.19) 


Че EV) = (a-i +E 42 (16) 
E(Vo) = ab-1o (17) 
E(V) = (%-10 +b a (18) 
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De (17), segue-se que 
V. 
eo les gi 19 
Е Гав p=? (19) 
de modo que S = zin (20) 


é sempre a melhor (não-viciada) estimativa de o? independentemente de H, ser 
verdadeira ou não. Por outro lado, de (16) e (18) vemos que somente no caso de 
Н, ser verdadeira, teremos 


Vs $ Au ке ай 
к(„ í хт) = ё E 4 ү) = e (21) 
de forma que somente em tal caso 
da Т ЕА Б ев (22) 


TRO (1l ab — 1 
dará estimativas náo-viciadas de 02. Se, entretanto, Н, não é verdadeira, temos, 
de (16) 


ЕФ) = "+22154 - (23) 


DISTRIBUICOES DAS VARIACOES 


Baseando-nos no Teorema 4-4, pág. 166, podemos demonstrar os seguintes 
teoremas fundamentais relativos ás distribuições das variações Vy, Vp e V. 


Teorema 9-1:V w/o? tem distribuição qui-quadrado com a (b — 1) graus de liber- 
dade. 

Teorema 9-2:Sob a hipótese de nulidade Н, V5/g? e V/g2 têm distribuição qui- 
quadrado com a — 1 e ab — 1 graus de liberdade, respectivamente. 

Saliente-se que o Teorema 9-1 é válido quer admitamos, ou não 77, , enquanto que o 

Teorema 9-2 só é válido se admitimos H,. 


O TESTE F PARA A HIPÓTESE NULA 
DE IGUALDADE DE MÉDIAS 


Se a hipótese nula IJ, não é verdadeira, isto é, se as médias dos tratamentos 
não são iguais, vê-se de (23) que S pode ser maior do que 02, com efeito tanto 
mais pronunciado quanto maior for a discrepância entre as médias. Por outro lado, 
de (19) e (20), pode-se esperar que 82 seja igual a 02 independentemente de as 
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médias serem iguais, ou não. Segue-se que uma boa estatística para testar a hipótese 
Н, é dada por 8 ЫҢ &. Se esta estatística for significativamente grande, podemos 
concluir que há diferenca significativa entre as médias dos tratamentos e, assim, 
rejeitar Ho. Doutra forma, ou aceitaremos Но ou deixaremos nosso julgamento 
pendente de análise ulterior. 

A fim de utilizar esta estatística, devemos conhecer sua distribuição — que é 
dada pelo teorema seguinte (conseqüéncia do Teorema 5-8, pág. 228): 
Teorema 9-3:A estatística F = 82/82 tem distribuição F com a — 1 e a(b — 1) 

graus de liberdade. 

O Teorema 9-3 permite testar a hipótese nula a determinado nível de signifi- 

cáncia, utilizando um teste unilateral da distribuição F. 


TABELAS DE ANÁLISE DA VARIÂNCIA 


Os cálculos necessários para o teste acima acham-se dispostos na Tábua 9-2, 
chamada tabela de análise da variância. Na prática, calcularíamos у e vp utilizando o 
método longo (3) e (8), ou o método abreviado (10) e (11), e em seguida calcularía- 
mos Py = Y — vp. Note-se que o número de graus de liberdade para a variação total, 
isto é, ab — 1, é igual à soma dos graus de liberdade para as variações entre trata- 
mentos e interiores aos tratamentos. 


Tábua 9-2 
Variação Graus de Liberdade Quadrado Médio F 
Entre tratamentos " ъъ $2 
a—1 $8 = i ur 
v, = ЬУ (z – #)2 а—1 85 
— d E te com 
Interior aos a—1, a(b — 1) 
v, 
tratamentos a(b — 1) | 89 == graus de 
wy = 9 — т | «Ы 1) | liberdade 
ls = ны La 
Total, 
Y = MO ab—i 
= D (=. ë) 
j,k | 


MODIFICAÇÕES PARA NÚMEROS 
DESIGUAIS DE OBSERVAÇÕES 


No caso de os tratamentos 1, ...,a terem diferentes números de observações, 


dias 


dos. Obtemos assim 


yo = Dima 
jik 

vw = Ð (8—2) 
ik 

Vus = VW 
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«sna respectivamente, os resultados acima podem ser facilmente modifica- 


onde > denota a soma em relação а k de 1 a nj c em seguida em relação a j de 
i 


laa, n= У, n; é o número total de observações em todos os tratamentos, т é 


a soma de todas as observações, ту. é a soma de todos os valores no tratamento de 


ordem / е br éasomadej- laa. 
j 


A tabela de análise de variáncia neste caso é dada pela Tábua 9-3. 


Tábua 9.3 
Variação Graus de | agrado Médio 
liberdade 


Entre tratamentos 


= B (ay ë)? 
ix 


e-i $2 = 
DESDE è 
1 
Interior aos 
tratamentos чан dm ss ak 
to = V—% ш 
Тоїа1, 
о = Vy 4. m 


CLASSIFICACAO DE DOIS CRITÉRIOS 
OU EXPERIMENTOS DE DOIS FATORES 


coma — 1, 
т — а graus 
de liberdade 


Podemos generalizar as idéias da análise da variáncia de um critério (ou para 
experimentos de um fator). Ilustramos a seguir o processo no caso da classificação 
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de dois critérios, ou experimentos de dois fatores. 


EXEMPLO 9.2. Suponha-se um experimento de natureza agrícola consistindo no exame das 
safras por are de quatro variedades diferentes de trigo, onde cada variedade é plantada em cinco 
lotes diferentes de terra. Tem-se então um total de (4) (5) = 20 lotes. Em tal caso é conveniente 
combinar os lotes em blocos, digamos, 4 lotes constituindo um bloco, com uma variedade 
distinta de trigo plantada em cada lote do bloco. São, então, necessários 5 blocos. 

Neste caso há duas classificações ou fatores, pois pode haver diferença na produção por 
are devido (i) ao particular tipo de trigo plantado ou (ii) ao particular bloco considerado (que 
pode envolver condições diferentes de fertilidade do solo, etc.). 


Por analogia com o experimento agrícola do Exemplo 9.2, costumamos 
referir-nos às duas classificações ou fatores em um experimento como tratamentos e 
blocos, mas nada impede, obviamente, que os designemos por Fator 1 e Fator 2, 
etc. 


NOTAÇÃO PARA EXPERIMENTOS DE DOIS FATORES 


Supondo que tenhamos а tratamentos e b blocos, construímos a Tábua 9-4, 
onde se admite que haja um valor experimental (p.ex., produção por are) corres- 
pondendo a cada tratamento e bloco. Para o tratamento j e bloco k denotamos este 
valor рог хуу. A média dos valores entrados na linha de ordem j é denotada por X; , 
(= 1, ..., а), enquanto que a média dos valores entrados na coluna de ordem Кё 
denotada por X x, (k= 1,...,b). A média global, ou geral, é denotada por E 
Em símbolos, 


" 14 : ¿ 1 
= PAL x= ¿Dim = ab hU (27) 
= Ё A 
Tábua 94 
Blocos 
1 2 b 
Е Eu Uis Vip 2; 
É 9o Lao Lap Ea 
5 
E 
Е 
Car Tab 
Pa E» " En 


VARIAÇÕES PARA EXPERIMENTOS DE DOIS FATORES 


Tal como no caso de experimentos de um fator, podemos também definir 
variações para experimentos de dois fatores. Primeiro, definimos a variação total, 
comoem(3: y = Y (па – 2} (28)- 


ik 
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Escrevendo a identidade 


Wa.— Ë = (йк 8. — Er 4) + (07, E) + (Ex — 8) (29) 
elevando ao quadrado e somando em relação a j e a k, podemos mostrar que 
V = 0 +0. Ve (30) 


onde уе = Variação devida a erro ou chance = У) (zy, — i — Ex +) 
pri 


Yp = Variação entre linhas (tratamentos) = b Y (i; — 4)? 


b 
ус = Variação entre colunas (blocos) = а У (21 — 2) 


A variação devida a erro ou chance é também conhecida como variação 
residual. 
Seguem-se algumas fórmulas abreviadas de cálculo, análogas às (10), (11) e 


(12). 


т? 
— d eds 
Sue es Ра 25 ab (81) 
LE т 
= > ; A 
vw — p p D e, (28) 
EP T- т? 
% = 20 (22) 
de = 4 — е — Ve (34) 


onde ту. é o total de valores entrados na linha de ordem j, 7, é o total de valores 
entrados na coluna de ordem k e 7 é o total de todos os valores entrados. 


ANÁLISE DA VARIÂNCIA PARA 
EXPERIMENTOS DE DOIS FATORES 


Para o modelo matemático de experimentos com dois fatores, suponhamos 
que a variável aleatória Хук cujos valores são os x;k possa escrever-se como 


Xy = nca B, Ag (35) 


Aqui и é a média global da população, a; é a parte de Хук devida aos diferentes 
tratamentos (por vezes chamada efeitos do tratamento), By, é a parte de Хур devida 
aos diferentes blocos (por vezes chamada efeito de blocos) e ^ jy. é a parte de Хук 
devida a erro ou chance. Como anteriormente, aqui também podemos tomar os 
“jk como variáveis aleatórias independentes normalmente distribuídas com média 
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zero e variância 0?, de modo que os Хук são também variáveis independentes nor- 
malmente distribuídas com variância o?. Sob hipóteses convenientes quanto às 


médias dos Xy temos 


20 =0 LB = 0 (86) 
1 
1 
4 2—— E E(X; 

o que dá H b jk (Хук) 

Em correspondéncia com os resultados (16) — (18), podemos provar que 
Etr) = e~t p а? (37) 
E(V) = b-i + а > 8? (38) 
E(Vo) = (a—1)(b-— 1) (39) 
E(V) = (ab-1)? +b z ota Èe (40) 


Há duas hipótese nulas a serem testadas: 
HQ Todas as médias de tratamentos (linhas) são iguais, i.e., 0 =0, /= 1, 
HO: Todas as médias de blocos (colunas) 0 iguais, isto é, ld =0,k= iM kj 
Vese de (39) que, independentemente de HÍ 1) ou HO, “melhor” estimador 
(ша -viciado) de o? é dado por 


TEN i Sa = 1) 
8: = 9-36. P "s E(S?) o (41) 
Outrossim, se HP Ho “são verdadeiras, então 
5% ES а " = Fã & = En (42) 
serão estimadores não-tendenciosos de 02, Se, entretanto, Ho De HP não são 
verdadeiras, temos, de (37) e (38), respectivamente 
д, b " 
E(S) = c+ 1325 (43) 
ES) = + ¿AYER (44) 
b-1*4 


Os teoremas que seguem sáo análogos aos Teoremas 9-] e 9-2, 


Teorema 94: Vejo? tem distribuição qui-quadrado com (a — 1)(b — 1) graus de 
liberdade, independentemente de Hf? ou HEP. 


Teorema 9-5: Sob a hipótese HP, Vr/0? tem distribuição qui-quadrado com 
a — 1 graus de liberdade. Sob a hipótese H(?, V./c? tem distribui- 
ção qui-quadrado com b — 1 graus de liberdade. Sob ambas as 
hipótesesH(? e Н, V/a” tem distribuição qui-quadrado com, 
ab — 1 graus de liberdade. 
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Para testar Н é natural considerar a estatística КЕКИ pois, por (43), 
A * " n n n 
podemos esperar que S? difira significativamente de o? se as médias de linhas 
(tratamentos) são significatiyamente diferentes. Analogamente, para testar H$? con- 
sideramos a estatística 52/52. As distribuições de 82/82 e 82/82 são 
dadas no seguinte teorema (análogo ao Teorema 9-3): 


Teorema 9-6: Sob a hipótese Н\? a estatística 82/82 tem distribuição F com 
a — 1 e (a — 1)(b — 1) graus de liberdade. Sob a hipótese Н? a 
estatística 52/82 tem distribuição F com b — 1 e(a— 1)(b — 1) 
graus de liberdade. 

O teorema possibilita aceitar ou rejeitar H$? ou Hí? а níveis de significância 

determinados. Por conveniéncia (tal como no caso de um fator), pode-se aqui 

também construir uma tabela de análise de variáncia, como se vé na Tábua 9-5 


Tábua 9-5 
Variação Graus de liberdade Quadrado Médio F 
32/82 
Entre tratamentos 3 
fed Фа = —. com a—1, 
= э. сат T a-1 le i 
vw, = b2(—2 (а —1)b—1) 
5 graus de liberdade 
3f 
Entre blocos ilg 
b-1 = com b=1, 
ve = @Б(Ф,—8)° ы (a — 16 — 1) 
t graus de liberdade 
Residual ou Aleatório 
(a«—1)(6—1) 
9. = v — t. — 9. 
Total, 
а = utott ab—1 


= Xi 
Dr 


EXPERIMENTOS DE DOIS FATORES COM REPETICAO 


Na Tábua 9-4 há apenas um valor correspondente a determinado tratamento 
e determinado bloco. Em geral é possível obter informações mais amplas sobre os 
fatores, repetindo o experimento; tal processo é conhecido como repetição. Nesse 
caso haverá mais de um valor correspondendo a um dado tratamento e dado bloco. 
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Admitiremos que haja c valores para cada posição; podem-se fazer modificações 
adequadas quando os números de repetições não são iguais. 

Em virtude da repetição, deve-se utilizar um modelo apropriado para substi- 
tuir o modelo dado por (35), pág. 443. Para obtê-lo, seja Xjky a variável aleatória 
correspondente à linha ou tratamento de ordem /, à coluna ou bloco de ordem k, 
e à repetição de ordem 1. O modelo é então dado por 

Хы = к + +В, Yi + Aga 
onde definimos m, «j, $, como antes, os Aja São variáveis aleatórias indepen- 
dentes normalmente distribuídas com média zero e variância 02, sendo Уу: Os 
efeitos de interação linha-coluna ou tratamento-bloco (em geral chamados simples- 
mente interações). Em correspondência com (36) temos 


Da, =0, ZA, = 0, Em = 0) Dra =0 (45) 


E 
Como anteriormente, a variação total v de todos os dados pode decompor-se 


em variações v», devidas a linhas, variações vc, devidas а colunas, variações v; devi- 
das a interação, e variação ve aleatória ou residual: 


V = 0+ vid ve (46) 
onde 
v = Y (аа 0)? (47) 
kl 

v = de 2 m ay (48) 

£ 

b 
ve = acm (Ex. — 5)? (49) 
т = EL (£i, — £j, — En + 2)? (50) 
ve = È (а ёк) (51) 


Nos resultados acima, os pontos nos índices têm significado análogo ao da pág. 
436. Assim, por exemplo, 

А 1 1 n 

É. = $c ps Ej = y > E. (52) 


kat 


Utilizando o número apropriado de graus de liberdade para cada fonte de variação, 
podemos montar a tabela de análise da variância (Tábua 9-6): 
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Tábua 96 
- Graus de 
Variação ikerdada Quadrado médio 
| ^22 
| 82/82 
Enire tratamentos, ^ | 
a-1 $E | com a —1, ab(c— 1) 
AP | graus de liberdade 
293 
Entre blocos, " 062 
b-1 8 = com b—1, ab(c — 1) 
ve graus de liberdade 
i " P 818; 
nteracáo, Ау i 
(«16-081 = aiei | сот (a— 1)(b— 1), ab(e — 1) 
vi graus de liberdade 
Residual ou Aleatória йай а СА 
ab(e — $3 ow 
d ab(c — 1) 
Total, | 
abc — 1 


As razões F da última coluna da Tábua 9-6 podem ser usadas para testar as 
hipóteses nulas 


0 


Ho”: Todas as médias de tratamentos (linhas) são iguais, isto é, q= 

Hy": Todas as médias de blocos (colunas) são iguais, isto é, Вк= 0 

Hj": Мао há interações entre tratamentos e blocos, isto é, Yjk=0 

Do ponto de vista prático, devemos primeiro decidir se H $* pode ou não ser 
rejeitada a um nível apropriado de significância, utilizando a razão F, 22/52 ‚Ча 
Tábua 9-6. Surgem então dois casos possíveis. 


Casol: Hj" não pode ser rejeitada. Neste caso, podemos concluir que as inter- 
ações não são muito grandes. Podemos então testar Hj" е Hj? usando 
as razões F 82/88 e 32/87 respectivamente, conforme Tábua 9-6. 
Alguns estatísticos recomendam misturar as variações neste caso, tomando 
o total у; + ve e dividindo-o pelo número total correspondente de graus de 
liberdade, (a — D(b — 1) + ab(c — 1), e utilizar então este valor para 
substituir o denominador $? no teste F. 


448 PROBABILIDADE E ESTATISTICA 


Caso Il: Hí? pode ser rejeitada. Neste caso, podemos concluir que as interações 
são significativamente grandes. As diferenças nos fatores seriam então 
importantes somente se fossem grandes, comparadas com tais interações. 
Por esta razão muitos estatísticos recomendam que Hj? e H(? sejam 
testadas utilizando-se as razões F 52/87 е 82/87 ao invés das indicadas 
na Tábua 9-6. Utilizaremos também este processo alternativo. 


A análise de variância com repetição se faz com maior facilidade totalizando 
primeiro os valores de repetição que correspondem a determinados tratamentos 
(linhas) e blocos (colunas). Isto tem como resultado uma tabela de dois fatores com 
entradas únicas, que pode ser analisada da mesma forma que a Tábua 9-5. O Proble- 
ma 9.13 ilustra o processo. 


PLANEJAMENTO EXPERIMENTAL 


As técnicas de análise da variância que acabamos de discutir aplicam-se após 
obtidos os resultados de determinado experimento. Todavia, a fim de obter tanta 
informação quanto possível, os detalhes de um experimento devem ser cuidadosa- 
mente planejados com antecedência. É o que se costuma chamar de planejamento 
do experimento. Damos a seguir alguns exemplos importantes. 


1. Aleatorização completa. Suponha-se um experimento de natureza agrícola como 
no Exemplo 9.1, pág. 435. A fim de planejar tal experimento, podemos dividir 
o terreno em 4 X 4= 16 lotes (indicados na Fig. 9-1 por quadrados, muito 
embora possam ter qualquer forma) e atribuir cada tratamento, indicado por 
A, B, C, D a quatro lotes escolhidos de modo inteiramente aleatório. A finalida- 
de da aleatorização é eliminar várias fontes de erro, tais como fertilidade do 
solo, etc. 


Aleatorização Blocos Quadrado Quadrado 
Completa Aleatorizados Latino Greco-latino 


Fig. 9-1 Fig. 9-2 Fig. 9-3 Fig. 9-4 
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2. Blocos Aleatorizados. Quando — como no Exemplo 9.2 — é necessário ter um 
conjunto completo de tratamentos para cada bloco, introduzem-se os tratamen- 
tos A, B, С, D em ordem aleatória em cada bloco I, II, Ш, IV (v. Fig. 9-2); por 
esta razão, os blocos passam a denominar-se blocos aleatorizados. Este tipo de 
planejamento é usado quando se deseja controlar uma fonte de erro ou variabi- 
lidade, a saber, a diferença nos blocos (linhas na Fig. 9-2). 


3. Quadrados Latinos. Em alguns casos, é preciso controlar duas fontes de erro ou 
variabilidade ao mesmo tempo, tais como diferença em linhas e diferença em 
colunas. No experimento do Exemplo 9.1, p. ex., erros em diferentes linhas e 
colunas podem ser devidos a variações na fertilidade do solo em diferentes partes 
do terreno. Em tal caso, é conveniente que cada tratamento ocorra uma vez em 
cada linha e uma vez em cada coluna, tal como na Fig. 9-3. O arranjo é chamado 
Quadrado Latino, pelo fato de se utilizarem as letras latinas A, B, C, D. 


4. Quadrados Greco-Latinos. No caso de ser necessário controlar três fontes de 
erro ou variabilidade, usa-se um quadrado greco-latino (Fig. 9-4), tal como o da 
Fig. 9-4. Consiste essencialmente de dois quadrados latinos superpostos, com 
letras latinas А, B, C, D para um e letras gregas a, fj, y, ô para o outro. A exigén- 
cia adicional a ser satisfeita aqui é que cada letra latina seja usada uma e somente 
uma vez com cada letra grega. Satisfeita esta propriedade, o quadrado se diz 
ortogonal 


Problemas Resolvidos 


CLASSIFICACAO DE UM CRITERIO 
OU EXPERIMENTOS DE UM FATOR 


9.1. Prove que 


У (20-9) = > (zy — 35) + » (dy — 8)? 


Temos xy -7 = (xy —%,) + (2, — €). Elevando ao quadrado e somando em relação a 
je К obtemos 

Bla? = Bigg) + 5 3,—2)2 + 2 2 (а —2,)(2,—2) 

фк Lk ik Lk 


Para provar o resultado desejado devemos mostrar que o último somatório é zero. Para 
tanto, procedemos como segue: 


“а b 
Z ernas) = 2 (8,2) [3 (ga -ap ] 
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ois a = É 
pi tn = у 


9.2. Verifique que (a) т = abã, (b) т, =D%,, (0) Dr, = ар®, 
i 


usando a notação da página 437. 


(а) 


рог (а). 


9.3. Verifique as fórmulas abreviadas (10)—(12), página 437. 


Temos 


= E 
= ai 

2 dk 
= а zh 


5 аў, 
5k 


У (ав = 
hk 


E (xj, — 28g + E?) 
= 2 5 Ta + abs? 
— B8(abz) + ada? 


— abi? 


usando o Problema 9.2(4) nas 32 e última linhas acima. Analogamente, 


w = Btg-s = 2 (27 — 222) + 22) 
= Ba — 22 23, + abel 
hk ik 
UY gw = 
= x( 3 22 5 y tabs 
a b А. 
= E 3 5a – 28 (aba) + аһ 
aM b 
12 
E 2 — х2 
в 2,72 — абз 
ix 72 
= Ж Bica EE 
ПР ab 


abr 
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usando o Problema 9.2(b) na 32 linha e o Problema 9.2(a) na última linha. 
Finalmente, (12) decorre do fato que v = vy + Vip OU Vu = 0 — Uy. 


9.4, A Tábua 9-7 dá a produção, em “bushels” por are, de certo tipo de trigo plan- 
tado em determinado tipo de terreno tratado com os fertilizantes A, B, ou E 
Determine (4) produção média para os diferentes tratamentos, (b) média global 
para todos os tratamentos, (c) variação total, (d) variação entre tratamentos, 
(e) variação interior aos tratamentos. Use o método longo. 


Tábua 9-7 


“Para simplificar os cálculos, podemos subtrair um número conveniente, digamos, 
45, de todos os dados, sem afetar os valores das variações. Obtemos então os dados da 


Tábua 9-3. 
Tábua 9-8 
8 4 b 4 
2.4 3 3 
4 6 5 m 


(а) As médias dos tratamentos (linhas) para a Tábua 9-8 sáo, respectivamente, 
# = J6+4+5+4) = 4, da = 1@+4+8+ = 8, 
a 1 
а = qU4+6+5+5) = 5 
As safras médias, obtidas somando-se 45 aos valores acima, são 49, 48 e 50 “bushels” 
por are para А, Be C, respectivamente. 
5 z= PITE) F4+24443+3444645+5) = 4 
Assim, a média global para o conjunto original de dados é 45 + 4 = 49 “bushels” 
por are. 
(© Variação total= y = Gy — xy 


ГА 
= B-47 +04 – 4)2 +65 – 4? +6 – 42 
+ Q-4^t4-4! +663 – 02 +63 – 4)2 
+ 4-4) (6-42! *6-4* 46-4? = 14 
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9.5. 


9.6. 


(d) Variação entre tratamento = vw, = b X (z,—4)? 
5 


4j4—4? + (3—4)? + (5 – 4)2] = 8 


(e) Variação interior aos tratamentos — v», = v vy = 14-8 = 6 
Outro Método. 
ту = Ely)? 
ik 
= (6-49 +04 – 4)2 (5-4) +(4 – 4)2 
+ 2-37 +04 – 3)2 +3 – 3)2 +03 – 3)2 
+ (4—5) +(6 – 5)2 +(5 – 5)2 (5 – 5) = 6 


Com referência ао Problema 9.4, determine uma estimativa não-tendenciosa 
da variância 02 da população a partir (а) da variação entre tratamentos sob a 
hipótese nula de médias iguais para os tratamentos, e (b) da variação interior 
aos tratamentos. 


As Up 
8 


(e) bU aci idis 
de Vin ZE 8 
qi # = abi) ^ 84—1 3 


Com referéncia ao Problema 9.4, podemos rejeitar a hipótese nula de igual- 
dade de médias (z) ao nível de significáncia de 0,05? (b) ao nível de 0,01? 


4 


22 
Temos F = xy E 
8 2/3 


com dq—1—3—1 —2 e a(b —1) = 3(4— 1) = Y graus de liberdade. 


(a) Com referência ao Apéndice F, com r; = 2 e r = 9, vemos que os —4,26. Como 
F=6>Foys podemos rejeitar a hipótese nula de igualdade de médias, ao nível de 
0,05. 


(b) Com referência ao Apêndice Е, com r; =2 e ry = 9, vemos que Fog = 8,02. Como 
F=6<Fo,9 não podemos rejeitar a hipótese nula, de igualdade de médias, ao nível 

de 0,01. 
A Tábua 9-9 dá a tabela de análise da variância para os Problemas 9.4—9.6. 
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Tábua 9-9 
Variação Graus de liberdade Quadrado Médio F 
T— 
Entre tratamentos ix 
a-1=2 m=3=a pea E 
w=8 2 $2 2/3 
> "— — TI 
Interior aos tratamentos P 3 com 2,9 
Va = 9— vp «b-1-(09-9|92-5-5 graus de 
= tios liberdade 
Total, ab—1= (8)(4) —1 
v= 14 =11 
ы. 
9.7. Use as fórmulas abreviadas (10)—(12) para obter os resultados do Problema 9.4. 


ныш» = 9+16+25+16 
+4+16+9+9 
| 16 +36 +25 + 25 
= 206 
Оштон т = З+4+5+4 
+2 +4143 +3 
+44 6+5+5 
= 48 
Assim 2 
v= Ee a 


= 206 — 192 = 14 


т, = 8448-4 = 16 
т = 2+4+8+8 = 12 
cy = 4655 = 20 


Também, т = 16412420 = 48 
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9.8. 


Então, 
Mp = 


(c) 


É conveniente dispor os dados como na Tábua 9-10. 


Tábua 9-10 


Os resultados concordam com os obtidos no Problema 9.4, e deste ponto em diante a 
análise prossegue como anteriormente. 


Uma companhia deseja adquirir uma dentre cinco máquinas diferentes A, B, 
C, D, E. Em um experimento planejado para decidir se há diferenga no rendi- 
mehto dessas máquinas, cinco operadores experimentados trabalham nessas 
máquinas durante períodos iguais. A Tábua 9-11 dá a produção em unidades. 
Teste a hipótese de que não há diferença entre as máquinas, ao nível de 


5 9 
(а) 0,05, (b) 0,01 Tábua 9-11 
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Subtraiamos um número conveniente, digamos 60, de todos os dados, obtendo a 
Tábua 9-12, 


Tábua 9-12 


" _ O _ _ 
Então р 2356 — (сузу — 2356 — 245 2111 
"E. _ (0 L a E 
Vp = 5 (4500) (55 = 900 245 = 655 


Construamos então a Tábua 9-13. 


Tábua 9-13 


Variação Graus de liberdade | | Quadrado Médio 


Entre tratamentos amis 4 22 ES = 163,75 
vy = 655 | 


Interior aos tratamentos | a(b— 1) = 5(4) 


Gus = тов 
ay, = 1456 = 20 0 (84) : 
Totais 
ab—1=24 
E v = 2111 


Para 4, 20 graus de liberdade, temos Коз = 2,87. Assim, não podemos rejeitar a hipó- 
tese ao nível de 0,05 e, portanto, certamente não a podemos rejeitar ao nível de 0,01, 
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MODIFICAÇÕES PARA NÚMEROS 
DISTINTOS DE OBSERVAÇÕES 


9.9. A Tábua 9-14 dá a vida média (horas) de amostras de três tipos diferentes de 
válvulas de televisão fabricadas por uma Companhia. Utilizando o método 
longo, teste, ao nível de (2) 0,05, (b) 0,01, se há diferença entre os três tipos. 


Tábua 9-14 


Amostra 1 


Amostra 2 


Amostra 3 


É conveniente subtrair um número adequado, digamos, 400, obtendo então a 
Tábua 9-15, 
Tábua 9-15 


Total Média 


Amostra 1 


Amostra 2 


Amostra 3 


В £A. 84 
X = Média global =37 * 7 


Nesta Tábua indicamos os totais de linhas, as médias das amostras ou dos grupos, 
e a média global. Temos entáo 
о = 5 (86-4) = (7—7) + (11-724 ++ +(8-7)2 = 72 
k 


$e 


ъ= Б (8-89 = Ena, — 8)? 
E 2 


i 
= 3(9 — 7)? + 5(7 — 5)° + 4(8- 17)? = 36 
Uy = v— vy = 72-36 = 36 
Podemos também obter vy, diretamente, notando que é igual a 
(TD 4-01.—9)?4- (9.— 9? + (4— 8 + (6—5Y*-- [B — B) 4- (b— by 
+ (2—5)? + (10—8)? + (8 — 8)? + (6—8)? + (8—8)? 
Os dados podem ser resumidos na tabela de análise da variáncia da Tábua 9-16. 
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Tábua 9-16 


Graus de 
liberdade 


Quadrado Médio 


Ora, para 2 e 9 graus de liberdade, temos, do Apéndice Е, Foys —4,26, Foo = 8,02. 
Assim, podemos rejeitar a hipótese de médias iguais (isto é, não existência de diferença 
entre os três tipos de válvula) ao nível de 0,05, mas não ao nível de 0,01. 


9.10. Faça o Problema 9.9 utilizando as fórmulas abreviadas incluídas em (24), (25) 
e (26). 


Da Tábua 9-15. 
n1=3, n9=5, пу= 4, n=12, 1,=27, T4225, T4232, T=84 


Temos, assim 


2 
=5 пиз o + 5 GÈ = ğ 


(em? , (gy? | (82)? _ (842 


Б 4 айы. 


3 


Utilizando estas fórmulas, a análise da variância prossegue como no Problema 9.9. 


CLASSIFICAÇÃO DE DOIS CRITÉRIOS 
OU EXPERIMENTOS DE DOIS FATORES 


9.11. A Tábua 9.17 dá a produção, por are, de quatro safras diferentes de cereais 
plantados em lotes tratados com três tipos de fertilizante. Utilizando o 
método longo, teste, ao nível de 0,01, se (a) há diferença significativa na 
produção por are, devida aos fertilizantes, (b) há diferença significativa na 
produção por are devida ao tipo de cereal. 
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Tábua 9-17 


Safra IV 


Safra Ш 


Safra I Safra ll 


45 64 


Fertilizante A 72 6,7 


Fertilizante В 8,8 7,8 9,6 7,0 


52 


Fertilizante С 5,9 6,8 5,7 


Calcule os totais рог linhas, as médias рог linha, os totais рог coluna е as médias 
por coluna, assim como a média global, como na Tábua 9-18. 


Tábua 9.18 


I 


Fertilizante A 


Fertilizante B 


Fertilizante C 


Total das 


Colunas Total Geral = 81,6 


Médias das 


Colunas Média Global = 6,8 


vy =Variação das médias de linhas em relação à média global 
= 4/(6,2—6,8)2 + (83-6,8)2+ (5,9 — 68] = 18,68 
Vo =Variacáo das médias de colunas em relação à média global 
4 — 6,8)? + (7,0 — 68? + (7,5 — 6,8)? + (6,3 — 6,8)?] = 2,82 


v =Variação total 
= (4,5 — 6,8)? + (6,4 — 6,8? + (7,2 — 6,8)? + (6,7 — 6,8)? 
+ (8,8 — 6,8) + (7,8 — 6,8) + (9,6 — 6,8)? + (7,0 — 68) 
+ (5,9 — 6,8)? + (6,8 — 6,8)2 + (5,7 — 6,8)2 + (5,2 — 6,8)? 


=23,08 


ve =Variação aleatória = v — v, — v, = 658 


Estes resultados conduzem à tabela de análise da variáncia da Tábua 9-19. 
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Tábua 9-19 
Variação m Quadrado Médio 
2 $2 = 6,84 
3 $2 = 0,94 
6 $2 = 1,097 


Ao nível de significância de 0,05, com 2 e 6 graus de liberdade, Fogs =5,14. 
Então, como 6,24 > 5, 14 podemos rejeitar a hipótese de que as médias de linhas 
sejam iguais e concluir que, ao nível de 0,05 há diferença significativa na produção 
devida aos fertilizantes. 

Como o valor de F corresponde às diferenças nas médias por coluna é menor 
do que 1, podemos concluir que não há diferença significativa na produção devida 


ao tipo de cercal. 


9.12. Use as fórmulas abreviadas para obter os resultados do Problema 9.11. 


Temos, da Tábua 9-18: 


E = 
die 
a 3 
2 = 
X4 
34a = 
Entào 
v 
v. 
De 


Ve 


(4,5)2 + (6,42 + --- + (622 = 577,96 
248 + 33,2 + 23,6 = .81,6 
(4,89 + (33,2)? + (23,62 = 2274,24 
(19,232 + (21,0)? + (22,5)? + (18,9)? = 1673,10 
2 
E 
- P q = 57196 — 55488 = 28,08 
1 2 1 
= 52% - "m = (27424) — 554,88 = 18,68 
es dl 2 _ 1 ES E 
= 250 -i = 80107810) — 55488 = 282 
= р-у = ww = 2308 — 13,68 — 2,82 = 6,58 
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о que concorda com o Problema 9.11. 


EXPERIMENTOS DE DOIS FATORES COM REPETIÇÃO 


9.13. Um fabricante deseja determinar a eficiência de quatro tipos de máquinas 
A, B, C, D na produção de porcas. Para tanto, anota o número de porcas 
defeituosas produzidas por cada máquina nos dias de determinada semana 
e em cada um de dois turnos de trabalho. A Tábua 9-20 dá os resultados. 
Faça uma análise de variância para testar, ao nível de significância de 0,05, se 
há (a) diferença entre as máquinas (b) diferença entre os turnos. 


Tábua 9-20 
Primeiro Tumo ' Segundo Тито 
3 з да 52 в а за 48 58 ва 
A 
B 
c 
D 


Os dados podem também dispor-se como na Tábua 9-21. Ali, indicam-se os dois 
fatores preponderantes, isto é, máquina e turno. Note-se que, para cada máquina, indi- 
cam-se dois turnos. Os dias da semana podem ser considerados como repetições do tra- 
balho de cada máquina para os dois turnos. 

Tábua 9-21 


FATOR 1 FATOR II REPETIÇÕES 
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A variação total para todos os dados da Tábua 9-21 é 
2 
p = вав ва 9724102 PE = 1946 — 17955 = 1804 


A fim de considerar os dois fatores preponderantes, isto é, Máquina e Turno, limitamos 
nossa atenção aos valores de repetição correspondentes a cada combinação de fatores. 
Esses valores acham-se dispostos na Tábua 9-22, que é, assim, uma tabela de dois fatores 
com entradas únicas. 


Tábua 9-22 
Primeiro Tumo Segundo Tumo TOTAIS 
5 
85 


som 


TOTAIS 


A variação total para a Tábua 9-22 — que chamamos variação subtotal vg, é dada por 
es, (412 (30)? | (492 


_ ae (319 , (88)2 _ (268)2 
cir сл READ E 5 E ROC 


= 18012 — 1795,6 = 65,6 


A variação entre linhas é dada por 


a 2 (62) 2 38)? 
о, = (54) + (85) 4 (83) + (66) _ (2689 _ 


x n 0 10 > 1846,6 — 1795,6 = 51,0 


A variação entre colunas é dada por 


(125)? , (1432 _ (2682 _ = 
. (125 , (1497 (or — 18037 — 1795,6 = 8,1 
We 20 20 40 , ? 

Subtraindo agora da variação subtotal уу a soma das variações entre linhas e entre colunas 
(уу + ve) obtemos a variação devida à interação entre linhas e colunas, que é 


щ = 0¿— Pp — v, = 65,6 — 51,0 — 8,1 = 65 


i 


Finalmente, a variação residual — que podemos encarar como uma variação aleató- 
ria, ou devida a erro, Ve (desde que admitamos que os diversos dias da semana náo 
acarretem diferengas importantes), se obtém subtraindo a soma das variações linha, 
coluna e interação (isto é, a variação subtotal) da variação total v. Vem: 

v, = v— (v, tutu) = v—v = 150,4 — 65,6 = 848 

Essas variações acham-se indicadas na análise da variância, Tábua 9-23. A Tábua dá 
também o número de graus de liberdade correspondente a cada tipo de variação. Assim, 
como há 4 linhas na Tábua 9-22, a variação devida às linhas tem 4 — 1 =3 graus de 
liberdade, enquanto que a variação devida às duas colunas tem 2 — 1 = 1 grau de liberda- 
de. Para determinar o número de graus de liberdade devidos à interação, notemos que há 
oito entradas na Tábua 9-22. Assim, o total de graus de liberdade é8 — 1 =7. Como 3 
são devidos às linhas, e 1 às colunas, o restante, 7 — (3 + 1)=3 é devido à interação. 


d 
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E como há 40 entradas na Tábua original 9-21, o número total de graus de liberdade é 
40 — 1=39. Assim, o número de graus de liberdade devidos à variação residual ou 
aleatória é 39 — 7 —32. 


Tábua 9-23 
| 
aa Graus de "m 1 
Variação ией | Quadrado Médio F 


Linhas (Máquinas) 
v, = 5L0 


Colunas (Tumos) 
v = 8d 


Interação, 


v = 65 


Subtotal 
= 65,6 


Aleatória ou Residual, 
ve = 848 


Total, 
v = 150,4 


Em seguida devemos determinar se há alguma interação significativa entre os fa- 
tores básicos (i.e., linhas e colunas da Tábua 9-22). Pela Tábua 9-23, vemos que, para a 
interação, F = 0,817, o que mostra que a interação não é significativa, isto é, podemos 
rejeitar a hipótese HÁ?) das páginas 447-448. Seguindo as regras das páginas 447-448, 
vemos que o valor de F calculado para as linhas é 6,42. Сото Fo95 =2,90 para 3 e 32 
graus de liberdade, podemos rejeitar a hipótese Mode que as linhas tenham médias 
iguais. Isto equivale a dizer que, ao nível de 0,05, as máquinas não têm igual eficiência. 

Para | e 32 graus de liberdade, F9,95 = 4,15. Então, como o valor de F calculado 
para as colunas é 3,06, não podemos rejeitar a hipótese HÇ? de que as colunas tenham 
médias iguais. Isto equivale a dizer que, ao nível de 0,05, não há diferença significativa 
entre os turnos 

Se para analisar os resultados, optamos pela mistura ("pooling") das variações 
residual e de interação, como recomendam alguns estatísticos, obtemos, para a variação 
mista, v; + ve = 65 +848 = 91,3 e 3 + 32-35 graus de liberdade, o que 
conduz a uma vatiância mista de 91,3/35 =2,61. A utilização deste valor, em lugar de 
2,65, no denominador de F na Tábua 9-23 não afeta as conclusões a que chegamos. 
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9.14. Faça o Problema 9.13 ao nível de 0,01. 


Ao nível de 0,01, ainda não há interação apreciável, de modo que podemos 
prosseguir. 

Como Fogg =4,47 para 3 e 32 gr. lib. e como o valor de F calculado para as 
linhas é 6,49, podemos concluir que, mesmo ao nível de 0,01, as máquinas não acusam 
mesma eficiência. 

Como Fo,99=7,51 para 1 e 32 gr. lib. e como o valor de F calculado para as 
colunas é 3,05, podemos concluir que, ao nível de 0,01, não há diferença significativa 
entre os tumos. 


QUADRADOS LATINOS 


9.15. Um fazendeiro deseja testar os efeitos de quatro fertilizantes diferentes, 
A, B, C, D sobre a safra de trigo. Para eliminar fontes de erro provenientes 
da variação de fertilidade do solo, ele aplica os fertilizantes em um quadrado 
latino disposto como na Tábua 9-24, onde os números indicam as safras em 
bushels por unidade de área. Faga uma análise da variáncia para determinar 
se há diferença significativa entre os fertilizantes ao nível de (a) 0,05 e 
(b) 0,01. 


Tábua 9-24 Tábua 9-26 


A 18 cm| Das Bu 
aa | = 


D 22 B12| A 15 C 19 


Tábua 9-25 
TOTAIS 
- - 
A 18 culpas rn 18 
+ | 
T I | 
D22 | B12| ащ} C19 | 68 
fa e 
B15| A20| С?з | Dm | 8 
— н 
сэз | рт | B10 | 417 70 
| | 
; | | 
TOTAIS чт та 73 a 295 
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Primeiro obtemos os totais das linhas e das colunas tal como indicado na Tábua 
9-25. Obtemos também a safra total para cada tipo de fertilizante, tal como na Tábua 
9-26. A variação total e as variações para linhas, colunas e tratamentos se obtêm então 
na forma usual. Temos 


5)2 
Variação total = v = (18)2 + (21)2 + (28)?  --- + (10)2 + (17)2 — eo 


= 5769 — 5439,06 — 329,94 


(752 | (682 | (822 


Variação entre linhas = v, = P. i A 1 T8 


5468,25 — 5439,06 = 29,19 


2 2 2 
Variação entre colunas = v, = tm + +03 Р 


(71 _ (295)? 
4 16 


= 5448,75 — 5439,06 = 4,69 


Variação entre tratamentos = v, = es + чен + вз" + өн = 255 
б 


= 5723,25 — 5439,06 = 284,19 


А análise da variáncia consta agora da Tábua 9-27. 


Tábua 9-27 
T mque 
=: | 
Variação | Graus de liberdade | Quadrado Médio P 

Linhas, 29,19 3 9,73 4,92 

Colunas 4,69 3 1,563 0,79 
Tratamentos, 284,19 3 94,73 47,9 

Resíduos, 11,87 6 1,978 
Total 329,94 15 | 


(a) Como Fo,5:34 =4,76, podemos rejeitar, ao nível de 0,05 a hipótese de igualdade 
das médias das linhas. Segue-se que, ao nível de 0,05 de significância, existe diferença 
na fertilidade do solo, de uma linha para outra. 
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Como o valor de F calculado para as colunas é inferior a 1, concluímos que não há 
diferença na fertilidade do solo nas colunas. 

Como o valor de F calculado para os tratamentos é 47,9 > 4,76, podemos con- 
cluir que há diferença entre os fertilizantes. 


(b)Como Foo:3, 29,78, podemos aceitar a hipótese de que não há diferença na fertili- 
dade do solo nas linhas (ou colunas) ao nível de 0,01. Todavia, devemos concluir 
ainda que há diferença entre os fertilizantes, ao nível de 0,01. 


QUADRADOS GRECO-LATINOS 


9.16. 


9.17. 


Deseja-se determinar se há diferença significativa no percurso por galão obtido 
com os quatro tipos de gasolina, А, B, С, D. Planeje um experimento utilizan- 
do quatro motoristas diferentes, quatro carros diferentes e quatro estradas 
diferentes. 

Como temos sempre o mesmo número (quatro) de tipos de gasolina, motoristas, 
carros e estradas, podemos utilizar um quadrado greco-latino. Suponhamos os diferentes 
carros representados pelas linhas e os diferentes motoristas representados pelas colunas, 
tal como indicado na Tábua 9-28. Atribuímos então os diferentes tipos de gasolina 
A, B, C, D às linhas e colunas, aleatoriamente, com a condição de que cada letra apareça 
apenas uma vez em cada linha e apenas uma vez em cada coluna. Assim, cada motorista 
terá oportunidade de dirigir cada carro e usar cada tipo de gasolina (e nenhum carro 
rodará duas vezes com a mesma gasolina). 


Tábua 9-28 


MOTORISTAS 
1 2 3 


Carros 


Atribuímos em seguida, aleatoriamente, as quatro estradas a serem usadas (deno- 
tadas por а, B, y, 8, sujeitando-as à mesma restrição imposta às letras latinas. Assim, 
cada motorista terá oportunidade de dirigir em cada uma das quatro estradas. Um arranjo 
possível é o que consta da Tábua 9-28. 


Suponha-se que, no experimento do Problema 9.16, os números de milhas 
por galão sejam os dados na Tábua 9-29. Use a análise de variância para de- 
terminar se há diferença significativa ao nível de 0,05. 
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Obtemos primeiro os totais para linhas e colunas, conforme Tábua 9-30. 


CARROS 


Tábua 9-29 
MOTORISTAS 


TOTAIS 


Em seguida obtemos os totais para cada letra latina e cada letra grega, como 


segue: 

Total de A: 
I Total de B: 

Total de C: 


Total de D: 


Total de 0: 
Total de 8: 
Total de y: 


Total de 0: 


т 


15 +16 + 15 +16 = 62 
19 +18 + 21 +23 = 81 
16+11+11 +14 = 52 


14 +16 +16 + 15 = 61 


14 +18 +15 +14 = 61 
16 +16 + 21 +15 = 68 
19 +16 +11 +16 = 62 


15 +11 + 16 +23 = 65 
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Calculamos então as variações correspondentes, utilizando o método abreviado: 


(70? _ (256)? 


4 qe * 4112,50 — 4096 — 16,50 


Linhas: (65% , (69)? , (62) 
mee a tou lou o 


. (642 , (61)? , (68)# | (68)? _ (256)? _ RU. 
Colunas: (68? , (SD ү 1583. (8 36? — 4102,50 — 4096 = 6,50 
¡2 ¡2 2 2 
Gasolimas: (62% + (81% q (62% | (61% (2507 L 4207,50 _ 4096 = 111,50 


(A, B, C, D) * Е ы Ee 


2 2 2 2 2 
Estradas: (OLE, (68%, (622, (65)? _ (250% — 4103,50 — 4096 = 7,50 


(0, B,y,8) * i: 
A variação total é 
(197 + 089 + (162+ oo + (1572 + (282 — 50 — ipia 4096 = 148,00 


de modo que a variação devida a erro (residual) é 


148,00 — 16,50 — 6,50 — 111,50 — 7,50 = 6,00 
Os resultados constam da análise de variáncia da Tábua 9-31, O número total de 
graus de liberdade é n? = 1 para um quadrado п X n. Linhas, colunas, letras latinas е 
letras gregas têm, cada uma, n — 1 graus de liberdade. Assim, o número de graus de 


liberdade para o erro é n2—1—d(n—1) = (n — 1)(r — 3). Em nosso caso, n =4. 
Tábua 9-31 
——— 
Variação Graus de liberdade | Quadrado e F 
Linhas (carros) 5,500 
3 5,500 E 
16,50 2,000 
is 2,167 
-— TORUM) 3 2467 = 108 
е 2,000 
Сазойпаз 37,167 
(4, В, С, р), 3 37,167 =18, 
111,50 2,000 
(о, В, y, д), ,500 mdi 
7,50 2,000 
Eno, | 
6,00 3 2,000 
Total, 
148,00 15 
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podemos rejeitar a hipótese 


Temos Fo,9s;33 = 9,28 € Fogg;3a = 29,5. Assim, 
s c ao nível de 0,01. 


de que as gasolinas 520 idênticas, ao nível de 0,05. 7 


PROBLEMAS DIVERSOS 


9.18. Prove que E oj = 0 ((15), página 438). 
As médias de tratamento são dadas рог 4; — # + a; Logo 


a a а а а 
u= XatE« = mt Es 2н Lou 
mid j=1 PL j=l i 


31 
onde utilizamos a definição y = (E 1)/а. Segue-se que Za; 


9.19. Deduza (a) a equação (17), (b) a equação (16), da pág. 438. 


(a) Por definição, temos 
Vo = 


м 
Я 
> 

E 
x 


= 


4 А 
=» a Sant] 


= 


ima Jima 


= S? 
onde Sj é a variáncia amostral para o tratamento de ordem j, tal como definida 


por (15), Capítulo 5. Então, como O tamanho da amostra é b, 
a 


EV) = Ъ E EGD 
j=l 
9 f N 
(0-12 
b 2 ue о | 
a(b — 1)e? 
utilizando (16), do Capítulo 5 
(b)Por definição, " 
Vo -àxmxQ-Xv 
A 
è a 
= b D Žž- 2 У Х, + а 
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pois X = (32) / 

j 
Entáo, omitindo o índice de somagáo, temos _ 
(1) EV) = EE, 
Mas para qualquer variável aleatória 


U, E(U3) = Var (U) + [E(U)). 


— abE(X?) 


Assim 
(2) E(X?) = Var(X,) + [E(X,)]2 
(8) E(X2 = Var(X) + [EGP 


Mas como as populações sob tratamento são normais, com médias uje variáncia 
comum 02, temos, pelo Teorema 5-4, página 222: 


u) Varg) = E 
(5) Var(X) = E 
(6) EX) = y = “to 
(7) EX = 4 


Utilizando em (1) os resultados (2) —(7), mais o resultado do Problema 9.18, temos 


2 2 
5, E + (ue+ 2 ~ ab [5 + в] 


ac? + bD (uta)? — e? — abp? 


Е(У,) 


Ш 


Ш 


(a—1)o? + abu? + 25и Ba; + 5 а? — abi? 


(a— 1)02 + 53 аў 


9.20. Prove o Teorema 9-1, página 439. 


Tal como se mostrou no Problema 9.19(a). 
V.=538 Pus mo 
но == а 9H 2 ` A E 


onde s é a variância amostral para amostras de tamanho b extraídas da população 
submetida ao tratamento j. Pelo Teorema 5-6, pág. 225, 052/02 tem distribuição qui- 
quadrado com b — 1 graus de liberdade. Então, como as variâncias sz são independen- 
tes, concluímos, pelo Teorema 4-4, pág. 166, que V,,/o? tem distribuição qui-quadra- 
do com a(b — 1) graus de liberdade, 
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9.21 No Problema 9.13 admitimos que não existiam diferenças significativas nas 
repetições, isto é, nos diferentes dias da semana. Podemos confirmar tal 
suposição, ao nível de significância (a) de 0,05, (b) de 0,01? 

Se há alguma variação devida às repetições, ela está incluída na chamada 
variação residual, ve = 84,8, da Tábua 9-23. Para determinar essa variação 
devida às repetições, utilizamos os totais das colunas da Tábua 9-21, obtendo 


(БТЗ , (Б1° , 692 | (412, 69% _ (268) 
p | O8 8 


Um = 8 "^ 8 8 


40 


= 1807 — 1795,6 = 114 
Como há 5 repetições, o número de graus de liberdade associado com essa varia- 
çãoé5 — 1=4. A variação residual, após subtraída a variação devida à repetição, é 


vi = 848 — 11,4 = 73,4. As outras variações são as mesmas que as da Tábua 9.23, 
A análise final da tabela de variância, levando em conta as repetições, consta da 


Tábua 9-32. 
Tábua 9-32 
Variação Graus de liberdade | Quadrado Médio В 
-— 
Linhas (máquinas), 17,0 
»,=51,0 3 0 2621 ^ 949 
Colunas (Turnos), 8,1 E 
vc=81 1 | 81 2,621 — 3,05 
Repetições 85 
(Dias da semana), 4 2,85 285 - 109 
Prep=11,4 ' | 2621 " 
Interação, 2,167 
— 3 2,167 | Zea” 0,827 
Aleatória ou Residual, 
938 28 2,621 
Р Total, 
»=150,4 


Da Tábua vemos que o valor de F calculado para a repetição é 1,09. Mas como 
Fogs =2,71 para 4 e 28 graus de liberdade, podemos concluir que não há variação 
significativa ao nível de 0,05 (e, assim, ao nível de 0,01) devida a repetições, isto é, os 
dias da semana não são significativos. As conclusões relativas às máquinas e aos turnos 
são as mesmas obtidas no Problema 9.13. 
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9.22. Descreva como utilizar as técnicas da análise de variância para a classificação 
com três critérios, ou experimentos com três fatores (com entradas simples). 


Elabore a tabela de análise de variância a ser utilizada. 


Admitimos a classificação em grupos A, denotados por А;, ..., Aq; grupos B, 
denotados por By, ..., Bp; e grupos C, denotados por C;,...,C¿. О valor que está 
em Aj, By e C, é denotado por худу. O valor £;,, por exemplo, denota a média dos 
valores na classe C, quando A; e Bk se mantém fixos. Significados análogos são atribuí- 
dos a F;; e 2. О valor 2, é a média dos valores para as classes B e C quando 4; é 
fixo. Finalmente, X denota a média global. 

Haverá uma variação total dada por 
(1) v = Y (0-7? 

E * 
que pode decompor-se em sete variações, tal como na Tábua 9-33. Essas variações são 
entre classes do mesmo tipo e entre classes de tipos diferentes (interações). A interação 
entre todas as classes é chamada, como anteriormente, variação residual ou aleatória. 

As sete variações em que (1) pode decompor-se são dadas por 

v = од + Ug UCA Dag + ове + сд + Vane 


onde 
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УСА grupos Ce А) | 


Tábua 9-33 
Variação Graus de liberdade Quadrado Médio F 
(entre os más SS 
уд grupos A) a —1, (a —1)(b — D(c — 1) g lib: 
(entre os = 205. 
YB grupos b) b —1, (a —1)(b — 1) — 1) g lib. 
(entre os PET p 
jc grupos C) 0—1, (a — 1) — 1X6 — 1) g lib. 
(entre grupos (ent) CENE ЛИН Зе 
"AB grupos А e B) ^B  (a—1)5—1)  |(a—1)(b—1,(a— nb, 
| g lib. 
— | E 
72.18%, 
(entre grupos cas er TN Vac Sac’ две 
vBC grupos B e C) 595-5 Sie (6-1 0—0  |(b—1(c-1,.6e-0206—2(€—2 
= _ А AM; 
(entre grupos | = as Vea з. g lib. 
(с—1)(4—1) =D 


(e— 1)(a— 1), (a — 1)(b — Dle—1) 


(entre grupos 
VABC entre grupos 
A.BeC) 


(«= 100 — 2e —1) 


de a Vane 
Ано (а DE De-D 


v (total) 


abe— 1 


Problemas Suplementares 


CLASSIFICAÇÃO DE UM CRITÉRIO, EXPERIMENTOS COM UM FATOR 


9.23. Faz-se um experimento para estudar as safras de cinco variedades de trigo, A, B, C, D, E, 
Atribuem-se quatro lotes de terra a cada variedade; as safras (bushels por arc) sáo as 
indicadas na Tábua 9-34. Supondo a mesma fertilidado dos lotes, e aleatória a atribuição 
das variedades aos lotes, determine se há diferença significativa entre as safras, ao nível 
de significância de (a) 0,05, (b) 0,01. 


9.24. Uma companhia deseja testar 4 tipos diferentes de pneus, 4, B, C, D. As vidas médias dos 
pneus (em milhares de milhas) constam da Tábua 9-35, onde cada tipo foi testado aleato- 
tiamente em 6 automóveis idénticos. Teste se há diferença significativa entre os pneus, ao 
nível de (a) 0,05, (b) 0,01. 
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Tábua 9-34 


9.25. Um professor descja testar três métodos de ensino diferentes, I, II, III. Para isto, escolhe 
aleatoriamente três grupos de 5 alunos, e cada grupo é ensinado por um método dife- 
rente. Dá-se então uma mesma prova a todos os alunos; os resultados (notas) constam da 
Tábua 9-36. Determine se há diferença significativa entre os três métodos, ao nível de 


significância de (а), 0,05, (b) 0,01. 


Tábua 9-35 Tábua 9-36 
Método I 


Método II 


Método III 


MODIFICAÇÕES PARA NÚMEROS DESIGUAIS DE OBSERVAÇÕES 


9.26. A Tábua 9-37 dá os percursos, em milhas, por galão de combustível, feitos por automó- 
veis idénticos, usando 5 tipos diferentes de gasolina, Teste se há diferença significativa 
entre os tipos de gasolina, ao nível de significáncia de (a) 0,05, (b) 0,01. 


9.27. Em um semestre, um estudante obteve as notas constantes da Tábua 9-38. Teste se há 
diferença significativa entre suas notas nas diversas disciplinas, ao nível (a) de 0,05, 


(b) 0,01. 
Tábua 9-37 Tábua 9-38 
Marca A | 12 15 14 11 15 Matemática 72-80 83 75 
Marca B 14 12 15 E Ciéncia B 81 74 77 
Marca C 11 10 Inglés m 82 90 87 80 
Marca D 15 16 Eronómia та "1 тт TO | 
10 


9.28. Prove os resultados (24), (25), (26), da página 441 para o caso em que os números de 
observações são diferentes. 
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CLASSIFICAÇÃO DE DOIS CRITÉRIOS OU 
EXPERIMENTOS COM DOIS FATORES 


9.29. 


9,30. 


9.31. 


9.32. 


9.33. 


9.34. 


9.35. 


9.36. 


Prove o resultado (30), página 443. 
Prove as fórmulas abreviadas (31) — (34), página 443. 


Os artigos de determinada indústria são fabricados por 3 operários utilizando 3 máquinas 
diferentes. O industrial deseja determinar se há diferença significativa (a) entre os operá- 
rios, (b) entre as máquinas. Faz-se um experimento para determinar o número de artigos 
produzidos por dia, por cada operário e cada máquina; os resultados constam da Tábua 
9.39. Dé a informação desejada, utilizando o nível de significância de 0,05. 


Tábua 9-39 
Operário 1 Operário 2 Operário 3 
Máquina A 23 27 24 
Máquina B 34 30 28 
Máquina C 28 25 ar 


Faça o Problema 9.31 ao nível de significáncia de 0,01. 


Plantam-se 4 tipos diferentes de sementes de milho em 5 blocos. Cada bloco é dividido 
em 4 lotes, pelos quais se distribuem então, aleatoriamente, os 4 tipos de semente. Ao 
nível de significância de 0,05, teste se a produção em bushels por are, indicada na Tábua 
9-40, varia significativamente (a) em função das diferenças do solo (isto é, os 5 blocos), 
(b) em função dos diferentes tipos de milho. 


Tábua 9-40 


TIPOS DE MILHO 
I П ІП IV 


BLOCOS 


toov» 


Faça o Problema 9.33 utilizando o nível de significáncia de 0,01. 


Suponha que, no Problema 9.24, a primeira observação para cada tipo de pneu seja feita 
em um determinado tipo de automóvel, a segunda observação em outro determinado 
tipo de automóvel, etc. Ao nível de 0,05, teste se há diferença significativa (2) entre os 
tipos de pneus, (b) entre os tipos de automóvel. 


Faça o Problema 9.35 utilizando o nível de significância de 0,01. 


9.37. 


9.38. 


9.40. 


9.41. 


9.39. 
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No Problema 9.25, suponha que o primeiro dado referente a método de ensino se refira 
a um estudante de determinada escola, o segundo dado a um estudante de outra escola, 
etc. Ao nível de 0,05, teste se há diferença significativa (a) entre os métodos de ensino, 
(b) entre as escolas. 


Faz-se um experimento para testar se a cor dos cabelos e o peso têm alguma influência 
nos resultados escolares obtidos por estudantes americanos do sexo feminino. Os resul- 
tados constam da Tábua 9.41, onde os números indicam os indivíduos colocados entre 
os primeiros 10%, Analise o experimento ao nívcl de 0,05. 


Tábua 941 
Ruivo Louro Castanho 
Alto 75 78 80 
Médio | 81 76 79 
Baixo 73 75 "f 


Faga o Problema 9.38 ao nível de 0,01. 


EXPERIMENTOS DE DOIS FATORES COM REPETIÇÃO 


Suponhamos que o experimento do Problema 9.23 se refira ao sul dos Estados Unidos e 
que as colunas da Tábua 9-34 indiquem agora 4 tipos diferentes de fertilizantes, enquan- 
to que experimento semelhante realizado no oeste dos EE, UU. dá os resultados da Tábua 
9-42. Ao nível de 0,05, teste se há diferença significativa (a) entre os fertilizantes (b) en- 
tre os locais. 


Tábua 9-42 


Faça o Problema 9.40 ao nível de 0,01. 


9.42. A Tábua 9-43 dá o número de artigos fabricados por 4 operários diferentes trabalhando 


em dois tipos diferentes, 1 e II, de máquina, em dias diferentes da semana. Ao nível de 
0,05, determine se há diferenga significativa (a) entre os operários, (b) entre as máquinas. 
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Tábua 9-43 
Máquina I Máquina II 
22 2 o4 sog pt gt qe y 
Operário A 15 18 17 20 12 14 16 18 1? B 
Operário В 12 16 14 18 11 11 15 12 16 12 
Operário C 14 17 18 16 13 12 14 16 м 11 
Operário D | 19 16 21 23 18 17 15 18 20 


QUADRADOS LATINOS 


9.43. Faz-se um experimento para testar o efeito, sobre a produção de milho, de 4 fertilizantes 
diferentes, A, B, C, D e das variações do solo em duas direções perpendiculares. Obtém-se 
o quadrado latino da Tábia 9-44, onde os números indicam a produção de milho por 
unidade de área. Ao nível d> 0,01, teste se há diferença significativa (a) entre os fertili- 


zantes, (b) nas variações do solo. 


Tábua 9-44 


C 8| 410 ZEE 


Rd! 
B 11 | D 15 


C 16 A 10 
A 14 C 12 


9.44, Faça o Problema 9.43 ao nível de 0,05. 


9.45. Com referência ao Problema 9.38, suponha- 

mos introduzido um fator adicional indi- Tábua 9-45 
cando a região £, M ou W em que o estu- 
dante nasceu, tal como exibido na Tábua 
9-45. Ao nivel de 0,05, determine se há 
diferenga significativa entre os resultados 
escolares obtidos pelos estudantes do sexo 
feminino, devido (a) à altura, (b) à cor dos 
cabelos, (c) à região de nascimento. 
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QUADRADOS GRECO—LATINOS 

9.46. A fim de produzir um tipo melhor de ragáo para galinhas, adicionam-se aos ingredientes 
básicos 4 quantidades diferentes de cada um de dois produtos químicos. As diferentes 
quantidades do primeiro produto são indicadas por A, B, C, D, e as do segundo produto 
químico рого, B, y, б. 

Dá-se a ração a pintos separados por grupos conforme 4 pesos iniciais diferentos, 

Wi, Wa, Ws, Wa, e 4 espécies diferentes 51,52, $3, Sa. Os aumentos de peso obtidos 
constam do quadrado greco-latino da Tábua 9-46. Faça uma análise da variância do 
experimento, ao nível de 0,05, indicando as conclusões que podem sex tiradas. 


Tábua 9-46 


9.47. Cada uma das 4 Companhias Су, Сз, Сз, Ca, fabrica 4 tipos diferentes de cabos Г;, 75, 
Тз, Tą. Quatro operários А, B, C, D, utilizando quatro máquinas diferentes а, B, y, б, 
medem as resistências dos cabos. As resistências médias são dadas no quadrado greco- 
latino da Tábua 9-47. Faça uma análise da variância, ao nível de 0,05, indicando as con- 
clusões que podem ser tiradas. 


Tábua 9-47 

Ca Ca Cs 
181 С, 193 D, 160 
D, 162 | А, 183 | Вр 145 


PROBLEMAS DIVERSOS 


9.48. A Tábua 9-48 contém dados sobre a ferrugem acumulada em ferro tratado quimicamente 
pelos processos А, B, ou C, respectivamente. Determine se há diferença significativa entre 
os tratamentos, ao nível de (a) 0,05, (5) 0,01. 
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Tábua 9-48 Tábua 9-49 


105 118 112 90 


Baixo 103 115 107 


Médio 108 112 93 104 96 102 


9.49. 


9.50, 


9.51. 


9,52. 


9.55. 


9.56. 


9.57. 


Em um experimento, medem-se os Q.l. de estudantes adultos do sexo masculino, de 
portes alto, médio e baixo. Os resultados constam da Tábua 9-49. Determine (a) ао nível 
de 0,05, (b) ao nível de 0,01, se há diferença significativa entre os escores de ОЛ. em 
função das diferenças de altura. 


Prove (a) a equação (37), (b) a equação (38) da página 444. 

Prove (a) a equação (39), (b) a equação (40) da página 444 

Dá-se um exame para determinar sc os veteranos ou não veteranos de diferentes QI. 
apresentam um melhor desempenho. Os escores obtidos constam da Tábua 950. Ao 


nível de 0,05, determine se há diferença significativa nos escores devido a diferenças 
(a) de status (veteranos ou não veterano), (b) de ОЛ. 


Tábua 9-50 
ОЛ. Alto QI. Médio QI. Baixo 
Veterano 90 81 74 
Não Veterano 85 78 70 
Р Tábua 9-51 
“aga o P: 9.52 utili: 1де 0,01. у T 
Faga o Problema utilizando o nível de 0,01 Alto Médio Baixo 
A Tábua 951 dá os escores de teste obtidos Este 88 80 "2 
por uma amostra de estudantes de diferentes 
partes do país, com diferentes Q.I. Analise 
a tabela ao nível de 0,05 e indique suas Oeste 84 78 15 
conclusões. 
Sul 86 82 70 
Faça o Problema 9.54 ao nível de 0,01. ке 
Norte 
бен 80 15 79 
lt 


No Problema 9.42, é possível determinar se há diferenga significativa entre os números 
de artigos fabricados nos diferentes dias da semana? Explique. 


Na análise da variância, sabe-se que se pode somar a, ou subtrair de, cada dado uma 
constante conveniente, sem afetar as conclusões. Isso é verdade também se se multiplica 


9.62, 


9.63. 


9.64. 


9.65. 


9.66. 
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ou divide cada lado por uma constante conveniente? Justifique sua resposta. 


. Deduza os resultados (43) e (44) da página 444. 
. Prove o Teorema 9-2, página 439. 
. Prove o Teorema 9-3, página 439. 


. Suponha que os resultados da Tabela 9-48 sejam válidos para a parte nordeste dos 


EE.UU., enquanto que os resultados correspondentes para a região ocidental são os cons- 
tantes da Tábua 952. Ao nível de 0,05, determine se há diferença significativa devida 
(a) a produtos químicos, (5) a localização. 


Tábua 9-52 * Tábua 9-53 


Com referéncia aos Problemas 9.23 e 9.40, suponha-se realizado um experimento adicio- 
nal na parte nordeste dos EE.UU., com os resultados indicados па Tábua 9-53. Ao nível 
de 0,05, teste se há diferença significativa (a) entre os fertilizantes, (b) devido à locali- 
zação. 

Faça o Problema 9.62 ao nível de 0,01. 

Faça uma análise de variância do quadrado latino da Tábua 9-54, ao nível de 0,05. e 
indique suas conclusóes. 


Planeje um experimento que conduza ao quadrado latino da Tábua 954. 


Tábua 9-54 
FATOR 1 


FATOR 2 


Faça uma análise da variância do quadrado greco-latino da Tábua 9-55, ao nível de 
0,05, e indique suas conclusões. 
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9.67. 


9.68. 


9.69. 


9.70. 


9.71. 


Tábua 9-55 
FATOR 1 


By 12 


FATOR 2 


Planeje um experimento que conduza ao quadrado Greco-Latino da Tábua 9-55. 


Descreva a utiliz: 
fatores com repetição. 


ação das técnicas da análise de variância para experimentos de três 


Elabore e resolva um problema que ilustre O processo do Problema 9.68. 


no Problema 9.21, tivéssemos obtido uma diferenca significativa entre 


Suponha-se que, 
o é, as repetições. As conclusões do Problema 9.13 teriam de ser 


os dias da semana, ist 
modificadas? Justifique sua resposta. 


Na prática, podemos esperar obter (4) um quadrado latino 2 X 2? (b) um quadrado 
greco-latino 3 Х3? Explique. 


ан А 


Apéndice À 
Apéndice B 
Apéndice C 


Apéndice D 


Apéndice E 


Apéndice F 


Apéndice G 
Apéndice H 


Apéndice 1 
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A 
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ÍNDICE ANALÍTICO. ‚2, ы екяз в» +» maris 


APÉNDICE A 


TÓPICOS DE MATEMÁTICA 


SOMAS ESPECIAIS 


Eis as somas de algumas séries que ocorrem na prática. Por definição, 0! = 1. 
No caso de séries infinitas, indica-se o intervalo de convergência. 


BOE 1324845 ы 
J= 
2. Уј = BHP Z+ pma = Mnt DO ET) 
j=1 
pi o Y g 
3. e 1+ -+ 5 +=р+ = 27 todo x 
a m gx E, (1) g+: 
4 snx = a +++... = Quem 
Sa en ew 
те oos 08, CA Ea 
b. созт = 1 errar 817 = 2 en todo x 
6 ao eg 2 3 >. 
to = Ше pair = e je] <1 
4-9 
UTR ER m ж аа ва 
т. mü-z)--2-5-5-4 --X$ used 
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FÓRMULAS DE EULER 
8. e” = coso +ізепб, e| = coso — ї ѕеп 0 
ei? + eri 


E = , 10 = 
9. соѕб 3 sen 


gio ү e” 
2i — 


A FUNÇÃO GAMA 
A função gama, denotada por I (7), se define como 


цю = [enterar n>0 (1) 


Fórmula de recorrência: 

T(n+1) = (т) (2) 
onde Г(1) = 1. Utilizando-se (2), pode-se obter uma extensão da função gama ao 
caso em que n < 0. 

Se n é inteiro positivo, 
r(n+1) = м! (8) 
Por esta razão, a função gama é por vezes chamada função fatorial. Propriedades 
importantes da função gama: 


r(p)rü—» = E (4) 
Para P = à, (4)dá i PNA 
(2) = ys (5) 
Para grandes valores de n, temos a fórmula aproximada de Stirling: 
T(n+1) ~ Venne” (6) 


onde o sinal ~indica que a razão dos dois membros tende para 1 quando n =, 
Em particular, se її é inteiro positivo grande, a expressão 
п! = V2mnter (2) 


dá uma boa aproximação de п! 


A FUNÇÃO BETA 
A função beta, denotada рог B(m, п) é definida por 


1 
B(m,n) = f wu" (1 — м)" du т> 0, п> 0 (8) 
0 
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Está relacionada com a função gama pela expressão 


T(m)r(n) (9) 


B(m,n) — Tm FÃ) 


INTEGRAIS ESPECIAIS 


Eis algumas integrais que ocorrem em probabilidade e estatística: 


PS 2 1 [= 
-a? dy — >0 
10. J, € de 3 RE a 


^m +1 
ыы O 
11, i ghe dy = oce a>0, m>-1 
gre = À teas 
12. f qe cos ba dz = 5 no a>0 
do 
13. b 679 cos bx da = aa a>0 
P = 5 20 
14. Í e~“ sen ba dz = Paw a 
15. f arenas = Ip) а> 0, p>0 
0 


16. y gar demo dy = T 602-400) Ма а> 9 
-M Va 


Е 2 1 [v „ж. b 
баз? d da te) =L T pO? —4ac)/4a -— ин > 
17. у e i da 2Na* erte (5 75) a>0 


onde 5 : 
erfe(u) = 1-erftu) = 1 x er dx 


x e 
= + € * dæ 
Vs da 


é a função erro complementar 
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* eos oz EE РЧ 
ы J, pra = 2a" 


пут 
19. f sen2m-1 0 costr-ig do = г(т) Г(п) 
0 


#г(т + n) 


а> 0, ъ> 0 


т> 0, п> 0 
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APÉNDICE B 


Ordenadas (y) da curva normal padronizada, 
no ponto z 


,0002 
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APÉNDICE C 


Área sob a Curva Normal 
Padronizada de 0 a z 


z 0 T 2 3 4 5 б d 8 9 
0,0 ‚0000 ‚0040 ‚0080 40120 ,0160 ,0199 ‚0239 ‚0279 ,0319 — ,0359 
0,1 ‚0398 ‚0438 10478 40517 10557 0596 ,0636 ‚0675 0114 ‚0754 
0,2 0793 20832 0871 40910 ,0948 ,0987 ‚1026 ,1064 ,1103 ,1141 
0,3 21179 ‚1217 ‚1255 ,1293 ‚1331 ‚1368 ‚1406 ‚1443 11480 ‚1517 
04 1554] 1591 ,1628 1664 1700 | ‚1736 ‚1172 ‚1808 ,1844 ,1879 
0,5 ,1915 ,1950 ,1985 2019 ,2054 ,2088 „212% ‚2157 ,2190 ,2224 
0,6 2258 2291 2324 2351 ,2389 ,2422 ‚2454 ‚2486 ‚2518 12549 
0,7 2580 2612 ,2642 2673 42104 32134 ,2164 ,2794 2823 ,2852 
03 2881 2910 ,2939 29617 12996 53023 ,3051 ,3078 ,3106 ,3133 
0,9 3159 ‚3186 3212 3238 .3264 53289 53315 43340 ,3365 ,3389 

E 3413 3438 3461 ,3485 ,3508 .3531 13554 3577 3599 ,3621 
11 3643 13665 ,3686 ,3708 ,3729 | 3749 3170 ,3790 53810 53830 

" 3849 3869 3888 3907 ,3925 3944 ,3962 ,3980 ,3997 A015 

3 4032 4049 14066 4082 4099 4115 4131 4147 4162 4177 
14 4192 44207 4222 4236 4251 4265 4279 4292 4306 4319 
15 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441 
L6 4452 4463 4474 4484 4495 4505 4515 4525 44535 4545 
17 4554 4564 14573 4582 4591 4599 4608 4616 ‚4625 4633 
L8 4641 4649 4656 4664 4671 4678 4686 14693 4699 ‚4706 
1,9 4713 A719 14726 4732 4738 4744 4750 4756 4761 4767 
20 | 4772 4778  ,4783 ,4788 4793 | 4798 4803 4808 4812 „4817 
21 4821 4826 4830 4834 4838 4842 4846 14850 14854 4857 
2,2 ,A861 4864 4868 4871 4875 4878 «4881 4884 14887 4890 
23 4893 4896 4898 4901 4904 ,4906 ,4909 4911 4913 4916 
24 ‚4918 4920 4922 4925 4927 4929 4931 14932 4934 ‚4936 
25 ‚4938 4940 4941 4943 4945 4946 ‚4948 ‚4949 ‚4951 4952 
26 4953 ,4955 ‚4956 44957 ,4959 | 4960 ,4961 .4962 4963 4964 
27 14965 4966 A967 4968 4969 4970 ,4971 4972 4973 4974 
28 4974 4975 4976 4977 ‚4977 ‚4978 4979 4979 ‚4980 ¡498.1 
29 4981 ‚4982 4982 4983 ,4984 ,4984 ,4985 ‚4985 ‚4986 4986 
3,0 44987 4987 ‚4987 ‚4988 ,4988 ,4989 4989 ‚4989 4990 ‚4990 
34 4990 ‚4991 4991 4991 ‚4992 4992 4992 „4992 ‚4993 ‚4993 
3,2 4993 4993 4994 4994 ‚4994 | ,4994 4994  ,4995 ‚4995 ‚4995 
3,3 4995 4995 4995 4996 ‚4996. ‚4996 4996 ‚4996 ,4996 ,4997 
34 4997 4997 44997 44997 4997 ,4997 ,4997 A977 4997 4998 
35 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998 
36 ‚4998 4998 4999 4999 ‚4999 54999 4999 ‚4999 4999 ‚4999 
3,7 4999 4999 4999 4999 4999 | ,4999 ,4999 4999 4999 4999 
38 4999 4999 4999 4999 ‚4999 4999 4999 ‚4999 ‚4999 ‚4999 
39 5000 5000 5000 5000 5000 5000 „5000 ,5000 ,5000 ,5000 


APÉNDICE D 


Valores de percentis (tp) 
para a distribuição + de Student 
com » graus de liberdade 
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fogo 


2325 
.289 


togo 


,727 
617 
584 
569 
559 
553 
549 
546 
543 
542 
540 
539 
538 
537 
536 
535 
534 
534 
533 
533 
532 
532 
532 
531 
531 
531 
S31 
530 
530 
530 
529 
527 
526 


10,995 


togo | Тозо | 0,95 
1,376 3,08 | 6,31 
1,061 | 1,89 | 2,92 

‚978 | 1,64 | 2,35 

2941 | 1,53 | 2,13 

,920 | 1,48 2,02 

,906 | 1,44 1,94 

,896 | 1,42 | 1,90 

,889 | 1,40 | 1,86 

883 | 1,38 1,83 

879 | 1,32 | 1,81 

,876 | 1,36 1,80 

,873 | 1,36 1,78 

870 | 1,35 | 1,77 

,868 | 1,34 1,76 

,866 | 1,34 | 1,75 

,865 | 1,34 1,75 

,863 | 1,33 1,74 

,862 | 1,33 1,73 

861 | 1,33 1,73 

,860 | 1,32 1,72 

,859| 1,32 | 1,72 

¿858 | 1,32 | 1,72 

,858 | 1,32 | 1,71 

857| 1,32 | 1,71 

856 | 1,32 1,71 

,856| 1,32 | 1,71 

855 | 1,31 1,70 

855 | 1,31 1,70 

854 | 1,31 1,70 

,854 | 1,31 1,70 

,851 | 1,30 | 1,68 

,848 | 1,30 | 1,67 

,845 | 1,29 1,66 


FONTE : FISHER, R.A. e YATES, F. Statistical Tables for Biological, Agricultural and Medical 
Reasearch, publicado por Longman Group Ltda., Londres (anteriormente publicada 
por Oliver and Boyd, Edinburgh). Com permissão dos autores e dos editores. 
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APÊNDICE E 


Valores dos Percentis (x7) 
para a Distribuição Qui-Quadrado 
com » graus de liberdade 


100| 67,3 | 701 | 742 | 77,9 | 82,4 | 901 | 993 


FONTE: PEARSON E.S. c HARTLEY H.O. Biometrika Tables for Statisticians, 
Vol. 1 (1966), Tábua 8, págs. 137 e 138. Com permissão. 
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APÉNDICE F 


95; Percentil (nível de 0,05), 
Fops, para a Distribuição F 
v, = graus de liberdade do numerador 


уз = graus de liberdade do denominador 


ШЕ 12 |15 | 20 | 24 | 30 | 40 | 60 


241 | 242 250 | 251 | 262 
19,4| 19,4 19,5 [19,5 | 18,5 
881|8,79 8,02 |8,59 | 8,57 
6,00 | 5,98 5,75 | 5,72 | 5,69 
4,77 4,74 4,50 | 4,46 | 4,43 
4,10 14,06 381|3,77|3,74 
3,68 | 3,64 3,38 3,34 |3,30 
3,9 | 3,95 3,08 |3,04 | 3,01 
зла 3,14 286 |2,82 |2,79 
3,02 | 2,98 2,70 |2,66 [2,62 
2,90 |2,85 2,57 |2,53 |2,49 
2,80 2,75 2,47 |2,43 |2,88 


18 | 4,67 2,81 3,41 [8,18] 3,03| 2,92 |2,83 | 277 |2,71 2,67 
14 | 460 |3,74 | 3,34 [3,11 |2,90 | 2,85 [2,76 2,70 | 2,65 2,60 
3,29 | 3,06 | 2,90 | 2,19 [2,71 | 2,64 |2,59 2,54 
16 | 4,49] 5,03 | 3,24 | 3,01 | 2,85 | 74 [2,66 [2,50 [2,54 2,40 
17 | 4,45 | 3,50 |3,20 [2,96 [2,81 | 2,70 |2,61|2,65/2,49 2,45 
18 |4,41 |355 | 3,15 |2,98 |2,77 | 266 | 2,58 | 2,61 | 2,46 | 2,41 
19 | 4,38 |3,52 3,13 |2,00 | 2,74 | 2,63 | 2,54 | 2,48 | 2,42 2,38 
20 | 435 13,49 13,10 |2,87 [2,71 2,60 |2,51 [2,45 |2,30 | 2,85 
21 | 432 |3,47 |3,07 | 2,84 | 2,58 | 2,57 | 2,49 242] 2,37 | 2,82 
22 | 4,30 3,44 |3,05 12,82 | 2,65 | 2,55 12,46 | 2,40 | 2,24 12,80 
29 |428|242 12,03 [2,80 | 2,64) 2,53 |2,44 | 3,37 | 2.32 | 2,27 
24 | 4,20 |3,40 3,01 |2,78 |2,62| 2,51 | 242 |236 | 2,30 | 2,25 
25 | 424 |3,39 2,99 | 2,76 2,60 | 2,49 | 240 2,34 2,28 2,24 
26 |4,23|3,97|2,98 | 2,74 2,59 | 2,47 |2,39 | 2,82 [2,27 | 2,22 
27 | 4,21 |3,85 |2,96 | 2,73 | 2,57 | 2,46 | 2,37 2,81 |2,25 | 2,20 
28 | 4,20| 3,34 | 2,95 |2,1 | 2,50 | 2,45 | 2,36 | 2,20 | 2,24 | 2,19 


2,98 [2,94 [2,80 
231 227222 
2,25 |2,20 | 2,16 
2,19 (2,15 2,1 
2,15 2,10 2,08 
2,11 2,06 2,02 
2,07 |2,05 1,98 
204 |1,99 1,95 
2,01|1,96 1,92 
198 | 1,94 | 1,89 
1,96 [1,91 | 1,86 
1,94 | 1,89 | 1,84 
1,92 |1,87 | 1,82 
1,90 |1,85 1,80 
1,88 | 1,84 | 1,79 
1,87 |1,89 1,77 


29 2,43 [2,35 | 2,28 | 2,22 | 2,18 1,85 |1,81 1,78 
30 2,42 | 2,33 | 2,27 | 2,21 | 2,16 1,84 |1,79 1,74 
40 2,54 [2,25 |2,18 | 2,12 | 2,08 1,74 |1,69 1,64 
60 2,25 |2,17 |2,10 | 2,04 | 1,99 1,65 [1,59 |1,53 
120 2,18 |2,09 2,02 | 1,96] 1,91 1,55 |1,50| 1,43 


1,46 |1,39| 1,32 


2,60 |2,27 2,21| 9,10 | 2,01 | 1,04 |1,88 | 1,83 


FONTE: PEARSON, E. S. e HARTLEY, H.O. Biometrika Tables Jor Statisticians, 
Vol. 2 (1972), Tábua 5, pág. 178. Com permissão. 
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APÉNDICE F 


99º Percentil (nível de 0,01) Fogo 
para a distribuição F 

y, graus de liberdade do numerador 
va graus de liberdade do denominador 


lalzlslaIsisIs[s|s 1] [16 | s | es | s | 0 |eo |a] = 


5764 5859 5106| 6157 | 6209) 6235 | 6261 | 6287 |6318] 6329 |6368 
90,3 | 99,3 [95,4 [99,4 | 99,4 | 99,5 | 99,5 | 99,5 [99,5 | 99,5 | 99,5 
28,2 |27,9 | 27,7 | 27,5 |27,3 | 27,2 | 27,1 | 26,9 | 25,7 | 26,6 | 26,5 | 26,4 | 26,5] 26,2 28,1 
15,5 | 15,2 | 15,0 [14,8 [14,7 | 14,5 | 14,4 | 14,2 | 140 | 18,9 [18,8 | 19,7 | 18,7] 13,6 | 13,5 
110 [10,7 | 10,5 [10,3 [10,2 [10,1 | 0,89 | 9,72 | 9,55 | 9,47 | 0,88 | 9,20 | 9,20 | 0,11 | 9,02 | 
вив 847 | 8,26 (вло [7,48 [0,87 7,72 | 7,56 | 1,00 | 7,31 | 7,23 | 7,14 | 06 | 0,97 [088 
тав |719 | 6,99 | 6,84 [6,12 |5,02 | 6,47 | 6,81 | 6,16 | 607 | 5,99 | 5,01 [5,82 | 6,74 | 6,65 
6,88 | 6,37 | 6,18 | 602 [5,91 |581 |567 | 5,52 528 495 | 4,86 
6,06 [5,80 | 561 |5,47 [5.35 [5,20 |511 | 496 | 481 | 4.73 4,40 | 4,31 
5,64 | 5,39 5,20 |50 4,04 [4,85 [4,91 | 4,56 | 4/01 | 4,33 | 425 | 4,17 408 | 4.00 | 3,91 
5,82 |5,07 | 489 | 4,74 |4,63 |4,54 |4,40 4,25 | 4,10 4,02 | 3,94 | 3,86 | 3,78 | 3,60 | 3,60 
506 4,30 |415| 4,01 E 
436 ало [3.96 | 382 359 
4,70 3,94 |3,80 | 3,56 заз [3,55 
156 3,80 |367 | 3,52 321| 
D 3,69 355 [3,41 310| 
4,34 3,59 | 3,46 | 3,81 3,00 
4,25 3,51 |3,37 | 3,28 2,92 
зиз [8,80 | 3,15 284 
3,37 |322 | 3,09 2,78 
331 |317 |303 218 


e €x Ww шшк 


2,83 | 2/05 
2,15 | 2,06 
2,67 | 2,58 
21|2,52 
246 
2,40 


3,51 


22 3,45 326 312 | 2,98 2,67 | 
эз 341 321 зот |2,93 2,52 2,85 

24 3,96 [3.26 |317 289 | 2,74 | 2,66 | 2,58 2,31 ] 
25 3,32 |322 [3,13 285 | 2,70 | 2,62 | 2,54 |227 | 


2,23 
2,20 


2,17 


3,20 [3,18 [3,09 2,82 | 2,66 | 2,58 | 2,50] 2, 
3,06 (2,93 [2,78 | 2,68 | 2,55 | 2,47 
60 | 2,52) 2,44 


3,89 


3,6 | 3,28 [3,12 13,03 |2,90 [2,75 | 2, 


y 
29 3,33 4,00 |2,87 [2,73 | 2,57 (2,49 | 2,41 2414 | 
30 380 2,98 12,84 [2,70 | 2,55 | 2,47 | 2,20 21 241 

пло |299 |2,89 [2,80 | 2,66 | 2,52 | 2,87 | 2,29 | 2,20] 2,11 | 2,02 | 1,92 


2,95 |2,82 [2,12 [2,63 [2,50 235 | 2,20 | 2,12 | 8,08] 1,94 | 1,84 [1,73 
2,79 | 2,66 [2,56 | 2,47 | 2,34 | 2,19 | 2,03 | 195 | 1,86] 1,76 | 1,56 | 1,53 
2,64 | 2,51 [2,41 |2,22 |218 | 2,04 | 1,88 | 1,79] 1,70) 1,59 | 1,47 | 1,32 


APÉNDICE G 


Logarítmos comuns com quatro decimais 


APÉNDICES 493 


E gg Partes Proporcionais 

q i 3 a 5 6 ч 8 9 12384508788 
10 | 0000 0043 0086 0128 0170 | 0212 0253 0294 0334 0374 | 4 8 12 17 21 25 29 33 37 
ii| 0414 0453 0492 0531 0569 | 0607 0645 0682 0719 0755 | 4 8 11 15 19 23 26 30 34 
12 | 0792 0828 0864 0809 0931 | 0989 1004 1038 1072 1100 | 8 7 10 14 17 21 24 28 81 
1з | 1139 1173 1206 1289 1271 | 1303 1235 1367 1399 1430 | 3 6 10 13 16 19 23 26 29 
14 | 1461 1492 1523 1553 1584 | 1014 1644 1673 1708 1732 | 3 6 9 12 1b 18 21 24 27 
15 | 1761 1790 1818 1847 1875 | 1903 1931 1959 1987 2014 | 3 6.8 11 14 17 20 22 25 
16 | 2041 2068 2095 2122 2148 | 2176 2201 2227 2253 2279 | 3 5 8 11 13 16 18 21 24 
17 | 2304 2330 2355 2380 2405 | 2430 2455 2480 2504 2520 | 2 5 710 12 15 17 20 22 
18 | 2558 2677 2601 2625 2648 | 2672 2695 2718 2742 2765 | 2 5 7 9 12 14 16 19 21 
19 | 2788 2810 2833 2856 2878 | 2900 2923 2945 2907 2989 | 2 4 7 9 1113 16 18 20 
20 | 3010 3032 3054 3075 3096 | 3118 3139 3160 3181 3201 | 2 4 6 81113151719 
21 | 3992 3943 3963 3284 3304 | 3324 3345 3305 3385 3404 | 2 4 6 5 10 12 14 16 18 
29 | 3494 3144 3464 3483 3502 | 3522 3541 3560 3579 3508 | 2 4 6 8 10 12 14 15 17 
28 | 3617 3636 3655 3674 3602 | 3711 3729 3747 3766 3784 | 2 4 6 7 911131517 
24 | 3802 3820 3838 3856 3874 | 3802 2009 3927 3945 3062 | 2 4 5 7 911 12 14 16 
25 | 3979 3997 4014 4031 4048 | 4065 4082 4099 4116 4183 | 2 3 5 7 910121415 
26 | 4150 4106 4183 4200 4216 | 4232 4249 4265 4281 4208 | 2 3 5 7 810111318 
эт | 4314 4330 4346 4302 4978 | 4393 4409 4425 4440 4456 | 2 3 5 6 8 9111314 
28 | 4479 давт 4502 4518 4533 | 4548 4564 4579 4594 4609 | 2 3 5 6 8 9111214 
29 | 4024 4630 4654 4669 4683 | 4098 4713 4798 4742 4757 | 1 3 4 6 7 9101213 
зо | атт: 4786 4800 4814 4829 | 1843 4857 4871 4886 4900 | 1 8 4 6 7 9101113 
31 | 4914 4928 4942 4955 4969 | 4983 4997 5011 5024 5038 | 1 3 4 6 7 8101112 
39 | 5051 5065 5079 5092 5105 | 5119 5182 5146 5159 5172 | 1 3 4 5 7 8 9 1i 12 
33 | 5185 5108 5211 5924 5237 | 5250 5203 5276 5289 5202 | 1 3 4 5 6 8 91017 
34 | 3315 5328 5340 5358 5366 | 5378 5891 5403 5416 5428 | 1 3 4 5 6 8 91011 
35 | 544i 5453 5478 5490 | 5502 5514 5527 5539 5551 | 1 2 4 5 6 7 91011 
36 | 5503 5575 5599 5611 | 5623 5635 5647 5658 5070 | 1 2 4 5 6 7 8 10 1l 
зт | 5682 5694 5717 5729 | 5740 5752 5763 5775 5786 | 1 2 3 5 6 7 8 910 
38 | 5758 5809 5832 5813 | 5855 5866 5877 5888 5 1235678 910 
39 | 5011 5922 5044 5955 | 5086 5977 5988 5999 1234578 910 
40 | 6021 6031 6053 gogi | 6075 6085 6096 6107 6117 | 1 2 3 4 5 6 8 910 
41 | 6128 6138 6160 0170 | 6180 6191 6201 6212 6222 | 1 2 3 4 5 6 7 8 9 
42 | 6232 6243 6263 cera | 6281 6294 6304 6314 6325 | 1 2 3 4 5 6 7 8 9 
43 | 6335 6345 6365 6375 | 6385 0895 6405 6415 6425 | 1 2 3 4 5 6 7 8 9 
ча | 6135 6444 0151 6464 6174 | 0484 6493 6608 6513 6522 | 1 2 3 4 5 6 7 8 9 
45 | 6532 6542 6551 6571 | 6580 6590 6500 6609 6618 | 1 2 3 4 5 6 7 8 9 
46 | 6628 6837 6646 6665 | 6675 6684 6603 6702 6712 | 1 2 3 4 5 6 7 T7 8 
ат | 6721 6730 6739 6758 | 6767 6776 6785 6794 0800 | 1 2 8 4 5 5 6 7 8 
48 | 6812 6821 6830 вив | 6857 6866 6875 6884 6893 | 1 2 3 4 14 5 6 78 
49 | 6902 6911 6920 5928 6937 | 6946 6955 6964 6972 6981 | 1 2 3 4 4 8 6 7 8 
во | водо 6998 7007 7016 7024 | 7038 7042 7050 7059 7067 | 1 345678 
51 | 1016 7084 7093 7101 7110 | 7118 7126 7135 T143 1 345678 
52 | 7160 7168 7177 7185 7193 | 7202 7210 7218 7226 1 suas ema 
53 7251 1259 7267 1275 | 7284 7202 7300 7308 $ 345667 
54 7332 7840 T7348 1356 | 7364 7372 7380 7388 7806 | 1 345667 
N| o0 i1 2 в «| 8 7 89 9 12 456789 


494 PROBABILIDADE E ESTATÍSTICA 


APÊNDICE G 


Logaritmos Comuns com Quatro Decimais 


n Partes Proporcionais 
no 1 z 3 4 FCT? € Dig A 
55 | 404 7412 419 7427 7436 | тааз 1451 T459 1466 таа [1 2 2 3 4 5 5 6 7 
56 | 7482 7490 7497 7605 7513 | 7520 7528 7636 7543 7651 | 1 2 2 3 4 5 5 6 7 
57 | 7559 7566 7574 7582 7589 | 7597 7604 7612 7619 7627 1 2 2 3 4 5 5 6 7 
58 | 1634 7642 7649 7657 7664 | 7672 7679 7686 7694 T7001 |] 1 2 8 4 4 5 6 7 
59 | 7709 7716 7728 7131 7738 | 7745 7752 7760 7767 TUA 1 1 2 3 4 4 5 6 T 
во | 7782 7789 7796 7803 7810 | 7818 7825 7832 7839 7846 | 1 1 2 3 4 4 5 6 6 
61 | 7853 7860 7868 7875 7882 | 7889 7896 7903 7910 79017 ]] 1 2 3 4 4 8 6 6 
62 | 7924 7931 7938 7945 7952 | 7959 7066 7978 7980 7987 | 1 1 2 8 3 4 5 6 6 
63 | 7993 8000 8007 8014 8021 | 8028 8035 8041 8048 8055 |] 1 2 з 3 4 5 5 6 
64 | 8062 8069 8075 8082 8089 | 8096 8102 8109 8116 8122 | 1 1 2 8 8 4 5 5 6 
65 | 8129 8136 8142 8149 8156 | 8162 8169 8176 8182 8189 | 1 1 2 3 3 4 5 5 6 
66 | 8195 8202 8209 8215 8222 | 8228 8235 8241 8248 8254 | 1 1 2 3 3 4 5 5 6 
67 | 8261 8267 8274 8280 8287 | 8293 8299 8306 8312 8319 | 1 1 2 з 3 4 5 5 6 
68 | 6325 8331 8338 8344 8351 | 8357 8363 8370 8376 8382 | | 1 2 8 8 4 4 5 6 
69 | 8388 8395 8401 8407 8414 | 8420 8426 8432 8439 8445 |] 1 2 2 8 4 4 b 6 
70 | 8451 8457 8463 8470 8476 | 8482 8488 8404 8500 8506 | 1 1 2 2 3 4 4 5 6 
71 | 8513 8519 8525 8531 8537 | 8543 8549 8555 8561 8567 | 1 1 2 2 3 4 4 5 5 
12 | 8573 8579 8585 8591 8597 | 8603 8609 8615 8621 8627 | 1 1 2 2 3 4 4 5 5 
тз | 8633 8639 8645 8651 8657 | 8663 8669 8675 8681 8686 | 1 1 2 2 3 4 4 5 5 
74 | 8692 8098 8704 8710 8716 | 8722 8727 8733 8739 8745 | 1 1 2 2 3 4 4 5 5 
75 | 8751 8756 8762 8768 8774 | 8779 8785 8701 8707 8802 |112 2 3 3 4 5 5 
76 | 8808 8814 8820 8825 8831 | 8837 8842 8848 8854 8859 | 1 1 2 2 3 3 4 5 5 
тт | 6865 8871 8876 8882 8887 | 8893 8899 8904 8910 8915 | 1 1 2 2 3 3 4 4 5 
18 | 8921 8927 8932 8938 8943 | 8949 8954 8960 8965 8971 | 1 1 2 2 3 3 4 4 5 
19 | 8976 8982 8987 8993 8998 | 9004 9009 9015 9020 9025 | 1 1 2 23 з 4 4 5 
во | 9031 9036 9042 9047 9053 | 9058 9063 9069 9074 9079 |] 1 2 2 8 3 4 4 5 
81 | 9085 9090 9096 9101 9106 | 9112 9117 9122 9128 9183 | 1 1 2 28 3 4 4 5 
82 | 0138 9143 9149 9154 9159 | 9165 9170 9175 9180 9186 | 1 1 2 2 3 8 4 4 5 
83 | 9191 9196 9201 9206 9212 | 9217 9222 9227 9232 9238 | 1 1 2 2 83 3 4 4 5 
84 | 9243 9248 9253 9258 9263 | 9269 9274 9279 9284 9989 | 1 1 2 2 8 3 4 4 5 
85 | 9204 9209 9304 9309 9316 | 0320 9325 9330 9335 9340 | | 1 2 2 3 3 4 4 5 
86 | 0345 9350 9355 9360 9305 | 9370 9375 9380 9885 9390| 1 1 2 2 3 3 4 4 5 
ВТ | 0395 9400 9405 9410 9415 | 9420 9425 9430 9435 9440| 0 1 1 2 2 3 8 4 4 
88 | 9445 9450 9455 9460 9465 | 9409 9474 9479 9484 9489 | 0 1 1 2 2 3 3 4 4 
89 | 9494 9499 9504 9509 9513 | 9518 9528 9528 9533 9588 | 0 1 1 2 2 3 3 4 4 
90 9547 9552 9557 0562 | 9566 9571 0576 9581 9586 | 0 1 1 2 2 3 8 4 4 
91 9595 9600 9605 0609 | 9614 9019 9624 9628 0633 | 0 1 1 2 2 8 3 4 4 
92 9043 9647 9652 9057 | 9661 9666 9671 9075 9680 | 0 1 1 2 2 3 3 4 4 
эз | 9685 9089 9094 9099 9703 | 9708 9718 9717 9722 9727 | 0 1 1 2 2 3 3 4 4 
94 | 9731 9736 9741 9745 9750 | 9754 9759 9763 9768 9773 0 1 1 2 2 3 8 4 4 
95 | 9777 9782 9786 9701 9795 | 9800 9809 9818810 1 1 2 2 3 3 4 4 
96 | 0823 9827 9832 9820 9841 | 9845 9854 98603 0 11 22 3 3 4 4 
от | 9868 9872 9877 энвт 9886 | 9800 9594 9899 908,0 11223344 
98 | 9912 9917 9921 9926 9950 | 9934 9943 9952 0/11 82 3 8 4 4 
99 | 9956 9901 9965 9960 9974 | 9978 9983 9987 9991 9900 | 0 1 1 2 2 3 3 3 4 
NI 1 2 4 5 6 7 MI тв 9| 


APÉNDICES 495 


APÉNDICE H 


Valores de e^ 


APÉNDICE H 
(0< A «1D 


,13$34 04979 ,01832 ‚006738 ,002479 ,000912 ,000335 


NOTA: Para obter e com outros valores de À, use as leis dos expoentes. 


Exemplo: e 2:48 = (e 2:99) (99:48) = (0,04979) (0,6188) = 0,03081 


496 PROBABILIDADE E ESTATÍSTICA 


APÉNDICE I 


Números Aleatórios 


74640 
23491 
60173 
02133 
19353 


03355 
84159 
56301 
91157 
17480 


RESPOSTAS DOS PROBLEMAS SUPLEMENTARES 


CAPITULO I 
157. (a А = (68,105,12,14] (b) A ={х|хёри ,5<w<15) 


1853. (а) 41,2,9,4,5) (е) {5} (e) Ø (9) {9,5,8} 
(b) (1,2,8,4, 5) (d) {5} (Р) 48) (h) {5} 


164 (а) {23,4} (b) (B) (9) (e]2>0,2%2,3,9 (Фф {44} (o) 8), 
(mes 
181. (a) 5/26 (b) 5/36 (с) 0,98, (d) 2/9 (е) 7/8 


1.82. (a) Probabilidade de rei na primeira extração e não-rei na segunda. 
(b) Probabilidade de ou rei na primeira extração, ou rei na segunda, ou ambos. 
(c) Não-rei na primeita ou não-rei na segunda extração; ou ambos (não-rei na 12 e na 
22 extrações). 
(d) N&o-rei nas 12, 28 e 3? extragóes. 
(e) Probabilidade de não-rei na primeira e rei па segunda extração ou náo-rei na segunda 
e rei na terceira extração. 


183. (а) 1/3 (b) 8/8 (с) 11/15 (d) 2/5 (е) 4/5 


1.84. (а) 4/25 (c) 16/25 (e) 11/15 (g) 104/225 (0 6/25 
(В) 4/75 (d) 64/225 () 1/5 (h) 221/225 (Й 52/225 
185. (а) 29/185 (c) 118/188 (е) 11/15 (0) 86/185 () 9/87 
(b 2/37, (d) 52/185 (1) 1/5 (h) 182/185 (5) 26/111 
186. (a) 3/10 (b) 1/10 Ye) 3/5 1101. (а) 12 (Б) 2520 (с) 720 
187. (а) 1/2197 (b) 1717.576 1102. п= 5 
188. 1/8 1108. 60 
194. 21/56 1404. (а) 5040 (Б) 720 (е) 240 
1.95. 21/31 1105. (а) 8400 (b) 2520 
196. 1/8 1106, (а) 32.805 (b) 11.664 
1.97. 14/57 1.107. 1260 


1100. 8 1108. (а) 120 (Ы) 72 (е) 12 


498 PROBABILIDADE E ESTATÍSTICA 


1.109, 


1110. 


1.111. 


1112. 


1413. 


1414. 


1115. 


1.116. 


1117. 


1.118. 


1.119. 


1122. 


1.123. 


1.124. 


1125. 


1.126. 


1427. 


1.128. 


1.129. 


1.130. 


1.131. 


(a)10 (6) т0 (0) 45 

т = 6 

210 

в40 

(a) 49.000 (Б) 7000 

(а) 120 (Б) 2520 

(а) 150 (0) 45 (е) 100 

(а) 17 (b) 163 

(a) 20 (6) 380 (о) 14/99 

(a) 28 + бабу + 152442 + 20223 + 15х2у* + Guys + уб 


(b) xí — 4z3y + 6x?y? — 4003 + yt 
(c) 25— 5x3 + 10% — 10071 + 5x73 — 275 


(d) 23 + 806 + 24x* + 32a? + 16 

2016 

(a) 5/18 (b) 11/36 (с) 1/36 

(a) 47/52 (b) 16/221 (e) 15/84 (d) 13/17 
(g) 40/51 (А) 77/442 

5/18 

(a) 81:44 (Б) 21:4 

(a) (130) (аза) GC (па) /әә Суз (b) 4/52 


(Са) (5C3)/14C5 
(a) 91/216 (Б) ao menos 17 
(а) 4º 1303/5205 (Б) (4Ca* 4804 + ¿Coso Ca 
40188) (вәС4)/ зг Соз 


2,95 х 1025 


(е) 210/221 (f) 10/13 
1133. 0,8% aprox. 


1135. vV11—8 


RESPOSTAS DOS PROBLEMAS SUPLEMENTARES 499 


1.138. (а) 120 (Ь) 60 (с) 72 1.140. 3125/46.656 
1.139. (а) 3/1250 (Б) 237/5000 1,141. (0) 4 (6) 14 
148. (а) 4/5265 (o) 45(4305)/5005 
(b) (13:2)(4)(6)/5,C5 (d) (6)(4)(8)(2)/(52)(61)(50)(49) 
1147. 2/248 
1148. (а) 126 (Б) 41, 1C, 
1449. (a) 462 (b) „16,1 
1.150. (a) 3/32 (Б) 1/18 (e) 1/82 (d) 1/8 
1.151. prob. Aganhar = 61/216, prob. B ganhar— 5/36, prob. empate = 125/216 
1.53. (а) 12/0С1а)(зәСаз) (b) 24/0С;з)(зәС:з) (ваз) 
CAPITULO 2 
E =] 
2.40. 
242. 3 4 
194,580 | 69,184 6768 192 1 
270,725 | 270,725 | 270,725 | 270.725 | 270,725 
„= е Г] 
246. (а) 
(b) 3/4 (о) 7/8 (9) 3/8 (е) 7/8 


500 PROBABILIDADE E ESTATÍSTICA 


247. (а) 3 (be3—e-9 (е) en? (0) 1—е7% 


— e-3r 
248. Fœ) = a 2 iia 


249. (a) 6/29 (b) 15/29 (е) 19/116 


5 


0 z«1 
| (2x3 — 2)/29  1<x<2 

250. Fla) = | (8224 2)/29 2<0<3 
E s>s 


251. (a) 1/27 (b) (о) 26/27 (d) 1/9 


| 22/9 0<x<3 
fe O em caso contrário 


| 0 x«0 
253. (а) 1/2 (Ы) 15/16 (0) 3/4 (d) Fa) = 3 4/1 0җх<? 
1 х 2 


254. (a) 1/86 (5) 1/6 (o) 1/4 (d 5/6 (e) 1/6 (Л 1/6 (9) 1/2 


j 216 v=1,2,3 ив y=1,2,3 
. _ йу с 
255. (0) fio) = 4o мы, () fot) = Ao demas 


251. (a) 3/2 (b) 1/4 (с) 29/64 (4) 5/16 


0 2<0 

258. (а) Fila) = ¿HP «9 06261 
1 ж 21 

т y<0 

(b) Fay = 3108 +0) 0<y<l! 

h y zl 


260. (e) fly) = fila) раа y — 1,9,3 (v. Problema 255) 
(b) Лу |а) = fly) para x =1,2,3 (v. Problema 2.55) 

261. (а) fely) = [+w EÐ 9€zs«l 0 <y <1 
lo demais x, 0 y <1 

(0) flule) = 1 » iii : a ы Bus | 


2.62. 


2.63. 


274. 


217. 


2.18. 


2.79. 


2.88. 


2.89. 


RESPOSTAS DOS PROBLEMAS SUPLEMENTARES 501 


(HH) O«s«i 0<y<1 
@ fel» = Lo demaisa, 0< y «1 
of | [PH+  0<ж<1,0<у<1 
) fepe = o 0< 2 « 1, demais y 
ez 5 20, y>0 
(a) reto = (5 mm 
e" 220, у 20 
(€) fule) = is 220, y«0 


в— Уч/д\/у para y > 0; 0 em caso contrário 
(27)-1/2y-1/2g=u рата у > 0; 0 em caso contrário 


1/7 рата —п/2 < y < т/2; 0 em caso contrário 
40- 0<у<1 


5 <у<1 
: И (0) 29) = 140-10-99 1<4<2 


0 ет caso contrária 


(а) gu) = | 


0 em caso contrário 
ve=/(1+u)? para u 0, v 20; 0 em caso contrário 
=Inz 0<z<1 x3e-2/6 2>0 
= 2.82. = 
WE) To endean va =, e «0 
u 0о<и<1 
gu) = 42-и 1«u«2 285. 1/4 
0 em caso contrário 
a 284. 35/288 
$9 = u<o pus 
[0 а<1 (d) 26/81 (є) 1/9 
2 b = 
(a) e» qn li-3- y<r<y+i y=1,2,8,... 


(d) Se? 


fi —e-:52z--1) æ 20 
(e) 5e-* — 7е—6 


(4 (0) Fla) = lo -— 


(a) 3/7 (b) 5/7 


(а) o0 —1 (Б) 8e-? — 2e-1— e-4 


502 PROBABILIDADE E ESTATÍSTICA 
291. (а) e,—2,c5 9 (Ы) 9e-?— 14e-3 (о) 4—5 — 46-7 (d)e?—e* 
(e) 4e-3 


«+4 0<a<l 
293. (а) 1/4 (b) 7/64 (е) f(x) = f 


19-1 0<y<2 
@ ^0 = 10 


em caso contrário 


0 em caso contrário 


emily у> 0 [180% и> 0 
208. (9) da em caso contrário e lo em caso contrário 
1 T d 1, 
296. (0 fü —1a2) (9 ¿+zin2 (0 ¿m2 


je cU 220 
298. = 
9€) = Jo 2<0 


299. (Б) 7/18 


2100. (b) 15/256 (е) 9/16 (9) 0 


2106. (o) 45/256 (Б) 1/14 


2408. v2/2 
CAPITULO 3 


3.43. (a)i (07 (06 


3.44. (а) 3/4 (Б) 1/4 (0) 3/5 


345. (а) 1 (092 (o1 


3.48. (o)1 (591 (01/4 


3.50. (а) 7/0 (Б) 6/5 (е) 19/10 (0) 5/6 


3.52. 


3.54. 


3.55. 


3.58. 


RESPOSTAS DOS PROBLEMAS SUPLEMENTARES 503 


(а) 2/3 (Б) 2/3 (є) 4/3 (d) 4/9 


(а) 7/12 (Ы) 7/6 
(с) 7/4 (d) 2/3 (е) 7/4 (7) 2/3 


(а) 3/2 (b)—29/6 (е) 1/4 (a) 1/4 

(a)n (b) 13n/6 

(а) 35/12 (b) V35/12 

(а) 4/8 (b) V373 

(а) 1 (51 

(а) Уаг(Х) = 5, ох = V6 (b) Var(X) = 3/80, ох = V15/20 

(а) 4 (b)2 

(а) 3/2 (Б) 39/4 (с) 39/2 

(a) 4(e/2-- 0-2) = cosht (Б) и 0, p= l, u$ — 0, nd —1 

(а) (14 2002 — е)/002 (b) и = 4/8, uj = 2, ud = 16/5, u4 = 16/3 


(а) щ = 0, 12 = 5, pa = —5, ва = 35 
(Б) шщ = 0, no = 8/80, ng = —121/160, u4 = 2.307/8.960 


(a) 101—0, [E «1 (0) e= 1, ni — 2, ni — 6, n4 = 24 

m=0, =l, 19=2, и = 38. 

(а) (B+1—=ak=D/+1)Mb=a) (b) [1+ (DO — a)k/2 +1 +1) 
peioa + geiob 

(sen ао)/ао 

(ežio — 2iežio — 1/42 

(а) 11/144 (Б) 11/144 (c) Vil/A2 (d) Y11/12 (e)—i/144 (f) —1/11 
()1 (д1 (e)1 (DI (90 (O 


(а) 73/960 (Б) 73/960 (с) V73/960 (d) V73/960 (e) —1/64 (f) —15/78 


504 PROBABILIDADE E ESTATÍSTICA 


3.80. 


3.91. 


(a) 233/824 (b) 233/324 (с) V233/18 (d) V233/18 (е) —91/824 
(f) —91/238 


(a) 4 (b) 4/V35 
—vi5/4 
(а) (82+ 2)/(62 +3) рма0< EL (b) (3y+2)/(6y + 3) para0 < y <1 


(a) 1/2 para g 20 (Б) 1 paraiy 20 


(a) X 
E(Y | X) | 4/3 


(a) 82 6m 
18(22 + 1)2 


E(X|Y) 


6y? + 6y +1 


18005 +17 P^ 0 Ey <l 


parao = e =1 (b) 


(a) 1/9 (6) 1 


x 
Ver(Y|X) | 5/9 | 4/5 | 24/49 
(b) Y 
Var(X|Y) | 5/9 | 29/36 


(a) 1 (b) 1/4 3.102. (a) não existe (6) =1 (00 


(c) e=2 (6) 05 3103. (93 (03 (03 


(a) +0 (6) 192 (01 34M. (а) 1— 4V3 (0) 1/2 


(a) 1/3 (b) /1-(1/V/2) (о) 8/15 


(a) х aiio ) GO 41-0872) (o VIZ (d) 1-(//10) 
(a) 1 (6) (V8—1)4 (е) 16/81 
(a) 1 (b O17 (е) 0,051 


(a) 1— 2e-! (b) n&oexiste 
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3114. (а) 2(/3—1)/3 (Б) 15/7 
3116. (a) 2 (0) 9 

3.18. (а) 0 (b) 24/64 

3119. (а) 2 (9 


3420. (а) 1/8 (b) 5/9 (с) (et - 2t + 3e3t)/6 
(e) 1/27 


(d) (eio + ZeZio + gesw)/6 


3421. (a) 1/3 (b) 1/18 (0) 200—1 9/0 (4) —2(eia — 1— ioo? 


(e) 17185 


3422. (a) 21/2 (b) 35/4 


3423. (а) 4/3 (e) (1 + 202: — czar 
(b) 2/9 (d) —(1 + 2ige?to — e2i2)/20? 
3124. 1 


3.25. (a) i (b) S2V2—1)15 
3426. (a) 2 (b) V2r/2 


3427. (a) 0 (b) 1/3 (00 


CAPITULO 4 


(e) —2V18/15 
(Р) 12/5 


461, (o) 1764 (b) 3/32 (е) 15/64 (4) 5/16 (є) 15/64 


4.62. (а) 57/64 (Б) 21/32 
463. (а) 1/4 (Ы) 5/16 (е) 11/16 (d) 5/8 


4.64. (а) 250 (Б) 25 (0) 500 


4.65. 


4.67. 


4.68. (а) 32/243 (b) 192/943 (с) 40/243 (4) 242/243 


4.69. (a)42 (Ы) 3,560 (c)—0,1127 (d) 2,927 


At. (a) npq(q—p) (©) пра — бра) + Зира? 


(7) 3/32 (y) 1/64 
(a) 17/162 (Б) 1/324 
64/243 


193/512 
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473. (a) 15,—1,0 (b) 72,90 
A34 (а) 54 (59 

4.75. > (a) 0,8767 (b) 0,0786 (с) 0,2991 

476. (а) 0,0375 (Б) 0,7128 (с) 0,9265 (4) 0,0154 (е) 0,7251 (Р) 0,0395 
447. (а) 0,9495 (0) 0,9500 (с) 0,6826 

4.78. (а) 0,75 (0) —1,86 (с) 208 — (d) 1,625 ou 0,849 (е) 1,045 
479. —0,995 

480. 0,0668 

481. (а) 20 (5) 36 (е) 227 tá 40 

482. (а) 93%  (b)8,1% (0) 0,47% (d) 15% 

A483. 84 

484. (а) 61,796 (Б) 54,7% 

485. (а) 95,4% (Б) 23,0% (с) 93,8% 

486. (c)115 (Ы) 0,77 

4.87. (а) 0,9962 (Б) 0,0687 (с) 0,0286 (d) 0,0558 

488.  (a)0,2611 (Б) 0,1342 

4.89. (а) 0,0567 (Б) 0,9198 (с) 0,6404 — (d) 0,0079 

490. 0,0089 

4.91. (a) 0,04979 (Б) 0,1494 (о) 0,2241 (4) 0,2241 (е) 0,1680 (f) 0,1008 
4,92, (а) 0,0838 (b) 0,5976 (с) 0,4232 

493. (a) 0,05610 (Б) 0,06131 

494. (а) 0,00248 (Б) 0,04462 (с) 0,1607 (d) 0,1083. (e) 0,6964 (у) 0,0620 
4101. (а) 5/8888 (Б) 5/324 


4.102. 


4.103. 


4.104. 


4.105. 


4.106. 


4.109. 


4.111. 


4.112, 


4.113. 


4.114. 
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(a) 0,000348 (Б) 0,000295 
3/8 


(a) 70/429 (b) 1/143 (е) 142/143 
13V (29 /(52 131 / 39 52 

ASAS) 
40) (20 60 

(0) AS 


(0) [Collao + (9C 1) оС зө) + (40C2) (2018) 1/60 зо 


13 18... ed 
(а) 3/4 (Б) 3/4 4120. (а) NET (b) $? A qe 1 


(a) 0 (b) 2(6— а)4/5 4.126. (а) 21,0 (Б) 26,2 (0) 23,3 


(a) 0 (Б) 9/5 4127. (a) 15,5 (b) 80,1 (0) 41,3 (d) 55,8 
1/4 4128. (a) 20,1 (b) 36,2 (0) 48,8 (d) 63,7 
(a) 3/4 (b) 1/3 4129. (a) 9,59 e 34,2 


4.130. (a) 16,0 (b) 6,35 (c) supondo áreas iguais em ambas as caudas. Xx =2170 X -144 


4131. (a) 1225 (Б) 179,2 

4432. (а) 207,7 (Б) 295,2 

4135. (а) 2,60 (Б) 1,75 (с) 1,34 (0) 2,095. (e) 213 

4.136. (а) 3,75 (Б) 2,68 (0) 2,48 (0) 2,39 (е) 2,33 

4.137. (a) 1,71 (Ы) 2,09 (о) 408 (d) —0,128 

4138. (а) 1,81 (0) 3,76 (е) —0,879 (4) —1,87 

4141. (а) 9,62 (6) 1,78 (е) 1,84 (0) 0,352 (6) 0,861 (f) 0,166 
CAPITULO 5 

549. (а) 90 (b) 447 (c) 90 (а) 316 
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5.50. (a) 9,0 (b) LAT (e) 9,0 (d) 2,58 

5.51. (а) ug = 22,40 oz, og = 0,008 oz 
(b) их = 22,40 oz, ox é ligeiramente int» га 0,008 oz. 

5,52, (а) ux = 22,40 oz, оў = 0,008 oz (b) ux = 22,40 oz, ex = 0,0057 oz 
(а) 237 (6) 2 (c) nenhum (4) 24 

554.. (a) 0,4972 (b) 0,1587 (с) 0,0918 (9) 0,9544 

5.55. (a) 0,8164 (b) 0,0228 (c) 0.0088 (d) 1,0000 

556. 0,0026 

5.57. (a) 0,0019 (b) 0,9596 (c) 0,1151 

5.58. (a) 2 (b) 996 (c) 218 

559. (а) 0,0179 (Б) 0,8664 (е) 0,1841 

5.60. (а) 6 (b) 9 (с) 2 (d) 12 

5.62. (a) 6 (b) 125 

5.63, (a) 0,0077 (b) 0,8869 

5.64. (a) 0,0028 (Б) 0,9172 

5.65. (а) 0,2150 (b) 0,0064 (c) 0,4504 

5.66. 0,0482 

5.57. 0,0186 

588. 0,0816 

5.70. (а) 118,79 Ib (b) 0,74 Ib 

5.711. 0,0228 

5.12. (а) 1000 (Б) 11,49 

5.73. (а) 40/3 (Б) 28,10 
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5.74. (а) 0,50 (Б) 017 (с) 0,28 
5.75. (а) 0,36 (Б) 0,49 
5.80. (a) menos de 0,01 (b) entre 0,01 e 0,05 mas muito mais próximo de 0,01 


5.81. (a) menos de 0,01 (b) menos de 0,01. 


5.82. (а) 799 (e) 100 (horas) (1) 19,0% 
(b) 1000 (Р 76 (5) 78,0% 
(с) 949,5 (g) 62/400 = 0,155 0u16,5% 
(d) 1099,5, 1199,5 (h) 29,5% 


5.86. (а) 24% (Б) 11% (с) 46% 


587. (а) 0,003 pols. 
(b) 0,3195, 0.3225, 0,3255, ..., 0,3375 pols. 
(c) 0,320-0,322, 0,323-0,325, 0,326-0,328, . .., 0,385-0,837 


5.92. 86 5.99. 501,0 

5.93. 0,505 5.100. 0,72642 pols. 

594 825 5.01. 26,2 

5.95. (а) 82 (b) 79 5102. (a) 2,16 (Б) 0,90 (с) 0,484 
5.96. 78 5.104. 45 

5.97. 80%, 20% 5.105. (а) 0,733 t (b) 38,60 

5.98. 11,09t 5106, (a) 2 —247 (Б) a =1,11 
5.107. (а) 0,000576 pols. (b) 72,19, 93,3%, 99,767 


5.108. (a) 146,8 Ib, 12,9 Ib 
5109. (a) 0,7849 pols. 0,00495 pols. 
5.111. (a) 6 (b) 40 (c) 288 (а) 2188 


5412. (a) O0  (b)4 (00 (d) 25,86 
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5113. (a) —1 (05 (c) —91 (d) 58 
5115. 0, 26,25, 0, 1198,1 
5116. 7 
5117. (a) 0,6, 19, 42 (b) —4, 22, —117, 560 (c) 1, 7, 38, 74 
5118. 0, 0,2344, —0,0586, 0,0698 
5121. ту = 0, m= 5,97, та = —3,97, m, = 89.22 
5422. m, — 0, m= 0,53743, my = 0,36206, ты = 0,84914 
5123. (а) 0 (с) 92,85 (е) 26,2 (0) 739,38 (i) 706.428 
(0) 52,95 (d) 7158,20 (Р) 7,28 (h) 22,247 (j) 24.545 
5.124. (a) —0,2464 (b) 2,62 5.128. (a) 7,2 (b) 84 
5125. (а) 0,4939 (b) 2,94 5.129. (a) 106 (b) 4 
5.126. Primeira distribuição 5.130. 159 
5.127. (a) Segunda (b) Primeira 5.131, (а) 78,7 (b) 0,0090 
CAPÍTULO 6 
6.29. (а) 9,5 lb (b) 0,74 102 (е) 0,78 e 0,86 lb respectivamente 
6.30. (а) 1200 h (b) 105,4 h 
6.31. (2) Estimativas dos desvios padrões populacionais para tamanhos de amostra 30, 50 e 
100 são respectivamente 101,7, 101,0 e 100,5 horas. Estimativa das médias popula- 
cionais: 1.200 horas em todos os casos. 
6.32. (a) 11,09 + 018 tons (Б) 11,09 + 0,24 tons. 
6.33. (a) 0,72642 + 0,000095 pols. (с) 0,72642 X 0,000072 pols. 
(B) 0,72642 +0,000085 pols. — (d) 0,72642 X 0,000060 pols. 
6.34. (a) 0,72642 + 0,000025 pols. (Б) 0,000025 pols. 
6.35. (a) Ao menos 96 (b) Ao menos 68 (c) Ao menos 167 (d) Ao menos 225 
6.36. (a) Ao menos 384 (b) Ao menos 271 (c) Ао menos 666 (d) Ao menos 900 
6.37. (a) 7,38 £0,82 onças (b) 7,38 +1,16 onças 
6.38. (a) 7,38 £0,73 onças (b) 7,38 +0,96 onças 
6.39. (a) 0,298 +0,030s (b) 0,298 50,049 s 


6.40, 


6.41, 


6.43. 
6.44. 
645. 
6.46. 
6.47: 
6.48. 
6.49. 
6.50. 
6.51. 
6.52, 
6.53. 
6.54. 
6.56. 
6.57. 


6.58. 
6.59. 
6.60. 


6.61. 
6.62. 
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(а) 0,70 £0,12, 0,69 +011 (b) 0,70 £0,15, 0,68 +0,15 
(c) 0,70 50,18, 0,67 £0,17 


(a) Ao menos 323 (b) Ao menos 560 (c) Ao menos 756 


(a) 1,07 10,09h (b) 1,07 +0,12h 
(a) 0,045 +0,073 (b) 0,045 + 0,097 (c) 0,045 t 0,112 
(a) 63,8 + 0,24 onças (b) 63,8 t 0,31 onças 
(а) 1800.1 24910 (b) 1800 +328 lb (c) 1800 Ł 382 Ib 
86 lb 
(a) Ao menos 4.802 (b) Ao menos 8.321 (c) Ao menos 11.250 
(a) 87,0 a 230,9 horas (b) 78,1 a 288,5 horas 
(2) 95,6 a 170,4 horas (b) 88,9 a 190,8 horas 
(a) 106,1 a 140,5 horas (Б) 102,1 a 148,1 horas 
(а) 0,269 27,70 (b) 0,453 a 4,58 
(a) 0,519 a 2,78 (b) 0,673 a 2,14 
(a) 0,138 a 10,8 (b) 0,259 a 5,02 
(a) 0,941 42,20, 1,067 21,944 (b) 0,654 21,53, 0,741 21,35 
As (xn 
3n 

Pu 

E) 


n 
ln (кр) 
(a) +4,60 (b) +3,06 (c) t2,79 (d) 22,75 (e) +2,70 
(a) 2400 +45 lbs, 2400 + 59 lbs (№) 87,6% 
105,5 a 139,6 horas 


k=-1- 


CAPITULO 7 


7.63. 


7.64. 


7.65. 


(a) 0,2606 


(a) Aceitar a hipótese no caso de extração de entre 22 e 42 bolas vermelhas; rejeitá-la 
em caso contrário. (b) 0,99 (c) Aceitar a hipótese no caso de extração de entre 24 
e 40 bolas vermelhas; rejeitá-la em caso contrário. 


(a) (Ho: р = 0,5), (Hi: p> 0,5). (b) Teste unilateral (с) Rejeitar- Н, no caso de 
extração de mais de 39 vermelhas, aceitá-la em caso contrário (ou não tomar deci- 
são). (d) Rejeitar Hy no caso de extração de mais de 41 vermelhas, e aceitála em 
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7.75. 


7.76. 


7.79. 


7.80. 


7.81. 


7.82. 


7.83. 


caso contrário (ou não tomar decisão). 


(a) Não podemos rejeitar a hipótese ao nível de 0,05. 
(b) Podemos rejeitar a hipótese ao nível de 0,05. 


Não podemos rejeitar a hipótese ao nível de 0,01, tanto em (a) como em (b). 


. Podemos rejeitar a alegação em ambos os níveis utilizando um teste unilateral, 


Sim, em ambos os níveis, utilizando um teste unilateral. 


. O resultado é significativo ao nível de 0,05 tanto para um teste unilateral como para 


um teste bilateral. 


Resultado significativo ao nível de 0,01 com um teste unilateral mas não com um 
teste bilateral. 


. (a)Sim (Б) Não 


Um teste unilateral, em ambos os níveis, mostra que a marca B é superior âmarca A. 


. Um teste unilateral mostra que a diferença é significativa ao nível de 0,05 mas não ao 


nível de 0,01. 

Um teste unilateral indica que o novo fertilizante é melhor, em ambos os níveis. 

(а) Um teste bilateral não acusa diferença de desempenho, ao nível de 0,05. 

(b) Um teste unilateral indica que o desempenho de B não é superior ao de 4, ao nível 


de 0,05. 


Um teste bilateral indica que não há evidência, cm qualquer dos níveis, de que a vida 
média se tenha modificado. 


. Um teste unilateral indica que não há diminuição na média, seja ao nível de 0,05, seja 


ao nível de 0,01. 


Um teste bilateral, em ambos os níveis, indica que o produto não atende às especifi- 
cações. 


Um teste unilateral em ambos os níveis mostra que O conteúdo médio de cobre é supe- 
rior ao especificado. 


Um teste unilateral mostra que o processo não deve ser adotado ao nível de 0,05, mas 
que deve ser adotado, ao nível de 0,01. 


Utilizando um teste bilateral ao nível de 0,05, não concluiremos pela existência de 
diferença na acidez. 


Utilizando um teste unilateral ao nível de 0,05, concluiríamos que o primeiro grupo não 
é superior ao segundo. 
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7.84. O aumento aparente de variabilidade não é significativo em nenhum dos níveis. 
7.85. O decréscimo aparente é significativo ao nível de 0,05, mas não ao nível de 0,01. 


7.86. Ao nível de 0,05 (mas não ao nível de 0,01) concluiríamos que o resultado é fora do 
comum. 


7.87. Não podemos concluir que a primeira variância seja maior do que a segunda, em 
nenhum dos níveis. 


7.88. Podemos concluir que a primeira variância é maior do que a segunda, em ambos os 
níveis. 


7.89. Não. 


7.90. (а) 0,3112 (b) 0,0118 (с) 0 (d) 0 (e) 0,0118 


7.94. (0) 8,64 +0,96 onças (5) 8,64 +0,83 onças (с) 8,64 + 0,63 onças 
7.95. (a)6 (b)4 


7.96. f(x)  ,Cx(0327 (068) — * , fregiiéncias esperadas: 32, 60, 43, 13 e 2, respectiva- 
mente. 


7.98. Freqüéncias esperadas 1,7; 5,5; 12,0; 15,9; 13,7; 7,6; 2,7; e 0,6, respectivamente. 


7.99. Frequências esperadas 1,1; 4,0; 11,1; 23,9; 39,5; 50,2; 49,0; 36,6; 21,1; 9,4; 31; e 
1,0, respectivamente. 


7.100. Freqüéncias esperadas 41,7; 53,4; 34,2; 14,6 c 4,7, respectivamente. 


e 270 
тло.) = (0617 € 961. geaiióncias esperadas: 108,7; 66,3; 20,2;4,1 e 0,7 respecti- 


vamente x! 

7.102. A hipótese não pode ser rejeitada em nenhum dos níveis. 

7.103. A conclusão é a mesma que a anterior. 

7.104. O novo instrutor não está seguindo o mesmo padrão de notas dos antecessores. (O fato 
de as notas serem superiores à média pode ser devido à melhoria da capacidade de ensino, 
ou abaixamento do nível, ou ambos.) 

7.105. Não há razão para rejeitar a hipótese de que as moedas sejam honestas. 

7.106. Não há razão para rejeitar a hipótese, em qualquer dos níveis. 


7.107, (a) 10, 60, 50, respectivamente (b) A hipótese de que os resultados sejam os mesmos 
que os esperados não pode ser rejeitada ao nível de 0,05. 
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7.108. A diferenga é significativa ao nível de 0,05. 

7.109. (a) O ajustamento é bom. (Р) Não. 

7.110. (a) O ajustamento é “demasiadamente bom”. (b) O ajustamento é pobre ao nível 0,05. 

7.111. (a) O ajustamento é muito pobre ao nível de 0,05. Como a distribuição binomial dá um 
bom ajustamento dos dados, isto é consistente com o Problema 7.109 (JO ajusta- 
mento é bom, mas não “demasiadamente bom”. 

7.112. A hipótese pode ser rejeitada ao nível de 0,05, mas não ao nível de 0,01. 

7.113. Mesma conclusão. 

7.114. A hipótese não pode ser rejeitada a nenhum dos níveis. 

7.115. A hipótese não pode ser rejeitada ao nível de 0,05 

7.116. A hipótese pode ser rejeitada em ambos os níveis. 

7.117. A hipótese pode ser rejeitada em ambos os níveis. 


7.118. A hipótese não pode ser rejeitada a nenhum dos níveis. 


7.123. (a) 0,3863; 0,3779 (com a correção de Yates) 


7.124. (a) 0,2205 ; 0,1985 (corrigido) (р) 0,0872; 0,0738 (corrigido) 
7.125.0,4651 


7.128. (a) Um teste bilateral ao nível de 0,05 não permite rejeitar a hipótese de proporções 
iguais. (b) Um teste unilateral ao nível de 0,05 indica que 4 tem maior proporção 
de vermelhas do que B. 


7129. (0)9 (0) 10 (c)10 (d)8 7.133. (a) Sim (b) Sim (е) Não 
7.132, (a)não (b)sim (c) não 7.134. (a) não (b) não (c) não 


7.137. Com um teste unilateral, o resultado é significativo ao nível de 0,05 mas não ao nível 
de 0,01. 


7.138. Ao nível de 0,05, não podemos concluir que a marca A seja melhor do que a marca В. 


7.139. Não ao nível de 0,05. 
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CAPITULO 8 


8.64. 


1,5 
(à) у= —$+уа ou y = —0,383 + 0,714 x 


(0) x= 1+2 ou æ = 1.00 + 1,29 y 


(а) 8,24, 8,24 (b) 10,00 
(0) y = 29,13 + 0,6612 (е) x = —14,89 + 115y (d) 79 (е) 95 
(8) y = 4000 + 0,500% (су x = 2,408 + 0,612 y 

У = 551 + 8,2002 —8) + 0,788(1—3)2 ош у = 2,51 — 1,20 + 0,733 02 
(b) d = 41,77 — 1,0960 + 0,0878602 (о) 170, 516 pé 

(b) y = 82,14(1,427): ou у = 39,14(10)%154= oy у = 32,1400,3558x (d) 387 
(а) z = 6140 — 3,65% + 2,54y — (b) 40 

(а) 1,804 (Б) 1,443 

(а) 2450 — (b) 1700 (е) 7,50 

0,5538 

1,5 

(a) 0,8961 (Б) y = 80,78 + 1,188x (e) 132 

(a) 0,958 (Б) 0,872 

(а) y = 08x + 12 (b = = 045y+1 


(a) 1,60 (b) 1,20 


=0,80 8.93, (a) 0,9927 
15% 895. rposto = à 
(a) —0,9203 896. (а) 0,5608 — (b) 0,9318 


3,12 8.97. (а) —1,0000 
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8.107. (a) 2,00 = 0,21 (Б) 2,00 + 0,28 


8.108. (a) Utilizando um teste unilateral podemos rejeitar a hipótese. 
(b) Usando um teste bilateral, não podemos rejeitar a hipótese. 


8109. (а) 37,0 - 36 — (b) 37,0 + 4,9 
8110. (а) 375,0 t L5 (Б) 370 = 2,1 
BM. (a) 138 —0,298 (Ы) 132,0 =192 (0) 1820 = 5,4 


8.112, (а) sim (Б) não 8.114. (а) 0,2923 e 0,7951 
(b) 0,1763 e 0,8361 


8.113. (a) não (Б) sim 8415. (а) 0,8912 e 0,7500 
(b) 03146 е 0,7861 


8.116. 0,7096 e 0,9653 8126. (a) y = 8884 — 664 
(b) 146,7 e 173,4 lbs 


8.117, (a) sim (b) não 8.127. (a) 20,36 lb 
(b) 3,80 pols. 
8120. 415 8.128. 0,4547 e 0,6158 


8.125. 0,5402 8.129. 0,9254 


8.130. (b)y —122,42 + 2,19 x, se a unidade — x é 1/2 ano e a origem é 1.1.54; ou 
y =107,9 + 4,38 x se a unidade — x é 1 ano e a origem é 1.7.50. 
(d)142,1 (e) 1971 


8.131. (b)y =18,16 — 0,1083 x + 0,4653 x? y sendo a taxa de natalidadc por 1.000 e a 
unidade —x 5 anos, com origem em 1.7.35. 


CAPITULO 9 
9.23. Existe diferenca significativa na safra em ambos os níveis. 
9.24, Não há diferença significativa nos pneus em qualquer dos níveis. 


9.25. Há diferenga significativa entre os métodos de ensino ao nível de 0,05, mas náo ao nível 
de 0,01. 


9.26. Há diferenga significativa entre as marcas ao nível de 0,05 mas nào ao nível de 0,01. 


9.27. Há diferença significativa nas notas em ambos os níveis. 


9.31. 


9.46. 


9.53. 


9.54. 
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Nao há diferenga significativa nos operários nem nas máquinas. 
Não há diferença significativa nos operários nem nas máquinas. 
Há diferenga significativa no tipo de milho mas nào no tipo de solo, ao nivel de 0,05. 


Não há diferença significativa nos tipos de milho ou de solos ao nível de 0,01. 


. Há diferença significativa tanto nos pneus como nos automóveis ao nível de 0,05. 


. Não há diferença significativa nos pneus nem nos automóveis ao nível de 0,01. 


Não há diferença significativa seja nos métodos de ensino ou nas escolas, ao nível de 
0,05. 


Não há diferença significativa nem na cor dos cabelos nem no peso. 


. Mesma resposta que no Problema 9.38. 


Há diferença significativa quanto às localizações ao nível de 0,05 mas não ao nível de 0,01. 


Não há diferença significativa quanto às localizações nem quanto aos fertilizantes ao 
nível de 0,01. 


. Há diferença significativa nos operários mas não nas máquinas. 


. Não há diferença significativa nem nos fertilizantes nem nos solos. 


Mesma resposta que no Problema 9.43. 


. Não há diferença significativa nos resultados escolares devida a diferenças de altura, 


cor dos cabelos ou lugar de nascimento. 


Há diferenças significativas em espécies c quantidades do primeiro produto químico, mas 
nenhuma outra diferença significativa. 


Há diferenças significativas nos tipos de cabos mas não nos operários, máquinas ou 
tesistência dos cabos. 


Não há diferença significativa nos tratamentos em nenhum dos dois níveis. 


. Não há diferenças significativas nos escores de ОЛ, em nenhum dos dois níveis. 


. Há diferenças significativas nos escores de notas, devidas tanto ao status de veterano 


como aos QL.L., ao nível de 0,05. 


Ao nível de 0,01 as diferenças nos escores devidas ao status de veterano não são signifi- 
cativas, mas as diferenças devidas ao Q.L são. 


Não há diferenças significativas nos escores de notas dos estudantes provenientes de 
diversas partes do país; há, porém, diferenças significativas nos escores de testes, devidas 
aos ОЛ. 
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9.55. 


9.61. 


9.62. 


9.63. 


9,64. 


9.66. 


Mesma resposta que para o Problema 9.54. 


Náo há diferengas significativas devidas aos produtos químicos ou a localização em 
nenhum dos dois níveis. 


Há diferenças significativas devidas à localização, mas não aos fertilizantes. 
Não há diferenças significativas devidas a localização ou aos fertilizantes. 


Há diferenças significativas devidas ao fator 1 mas não ao fator 2 ou aos tratamentos 
ABC 


Não há diferenças significativas devidas aos fatores nem aos tratamentos. 
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379-380, 409412 
múltipla, 374-375, 397-399 
não-linear, curvas de, 378 
plano de, 375 
reta de, 380 
superfície de, 375 
teoria amostral da, 381-382, 412-414 
Rejeição, região de, 301 
Relação linear, 369, 374, 405-406 
Relações de regressão não-linear, 369, 
405-406 
Repetições, 436, 445-448, 460-463 
Replicações (>. Repetições) 
Resíduo, 371 
Resultados igualmente prováveis, 8 
Reta 
de mínimos quadrados, 372-373, 
384-393, 412, 416-417 
em termos da variância e covaráncia 
amostrais, 373-374 
intersecção, 373, 388-389 
real, 2 


Séries, 483 para valores médios previstos, 382 


envolvendo diferengas de médias, 304, 
306, 320-324 

envolvendo diferenças de proporções, 
304-305, 320, 324 

envolvendo médias, 303, 305-306, 
313-319 


de Fourier, 115, 140 para valores previstos, 382 
de Taylor, 113, 128 para variáncias, 306-307 
Significáncia, regiáo de, 301 relação com a teoria da estimação, 
nível de, 300-301, 315-317 308 
experimental ou descritivo, 317 unilaterais, 302 
testes de (v. Testes de hipóteses) Total geral, 60 
Significância provável, 317, 320, 326, 339 Transformação 
Símbolos de inclusão, 5 invariância sob, 373, 377, 390 
Somas especiais, 483 Z de Fisher, 383 
Spearman, fórmula de, Transformada inversa de Fourier, 115 
dedução da, 407-408 Tratamentos, 436 
para correlação de postos, 378, 407-409, Triângulo de Pascal, 35 
421 
Subconjuntos, 2 
próprios, 2 União de conjuntos, 3 
Sucesso, probabilidade de, 155 Unicidade, teorema da, 
para funções características, 115 
Tabela para funções geratrizes de momentos, 
de probabilidade conjunta, 59 114 
de valores de exponenciais, 495 Unidades 
Tabelas de contingência, 311-312, 345-350 ou dimensões, 111 
Tamanho da amostra, 218 padronizadas, 112 
Temperatura Kelvin, 214 Universo, 2-3 
Tempos de reação, 267, 283 
Teorema (regra) de Bayes, 12-13, 29 Valores 
Teoria amostral exata, 226, 275-276 críticos, 274 
Teste qui-quadrado de aderência de de tendência, 418-421 
ajustamento, 309-311, 345 Variação 
Testes explicada, 376, 381, 402, 405-406 
bilaterais, 302 não explicada, 376, 381, 402, 405-406 
de hipóteses e de significância, 299-368 residual, 443, 462 
envolvendo a distribuição F, 305, total, 376, 381, 402, 405-406 
307, 327-328 i graus de liberdade para a, 440-441, 
envolvendo a distribuicáo normal, 444-445 
301-302, 303 na análise да variáncia, 438, 442 
envolvendo a distribuição qui-quadrado, Variações 
305, 306-307, 310-311 distribuições de, 439 
envolvendo a distribuição t, 305-306, entre colunas ou blocos, 442-443 
324-326 entre linhas ou tratamentos, 442-443 


entre tratamentos e interiores aos 
tratamentos, 437, 451-452 

explicadas e náo explicadas, 476, 381, 
402, 405-406 

graus de liberdade para, 440-441 

métodos abreviados para obtenção de, 


envolvendo proporções, 304, 313-319 ‚ 1437 
envolvendo razões de variâncias, 307 para experimentos de dois fatores, 
para coeficiente de correlação, 382-383 443-445 


para coeficiente de regressão, 
381, 412-413 

para grandes amostras, 303-305 
para pequenas amostras, 305-307 


valores esperados das, 438-439 
Variáncia, 110-111, 125-127 
amostral, 224-225 
esperanga da, 273 


Variáveis 


cálculo para dados grupados, 230-232, 
252-257 
como momento de segunda ordem, 112 
condicional, 118, 134 
conjunta (pooled), 306 
da distribuição amostral de médias, 
221-222 
binomial, 156, 174-175 
F,168 
normal, 159 
Poisson, 160 
£,167 
para distribuições conjuntas, 116-117 
para um conjunto de números, 110 
populacional desconhecida, 226-227, 
246-247 


aleatórias, 51, 66-67 
adimensionais, 112 
assintoticamente normais, 160, 222, 
226 
com distribuição beta, 164-165 


com distribuição gama, 164 
contínuas 51 
dependentes (». independentes) 
discretas, 51, 66-67 
distribuídas binomialmente, 155-156 
distribuídas normalmente, 158 
distribuídas segundo Poisson, 160, 
354-355 
distribuídas uniformemente, 163-164 
independentes, 61-62, 71-76, 89 
náo correlacionadas, 117 
padronizadas, 112, 126-127, 158 
dependentes, 370, 374, 383-384, 
386-387 
estocásticas (v. Variáveis aleatórias) 
transformadas, 370 


Variável independente, 370, 374, 384, 


386-387, 388-389 


Yates, correção de, para continuidade, 


312-313, 340, 343-344, 347 


